定义:算法(Algorithm)是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制。也就是说,能够对一定规范的输入,在有限时间内获得所要求的输出。如果一个算法有缺陷,或不适合于某个问题,执行这个算法将不会解决这个问题。不同的算法可能用不同的时间、空间或效率来完成同样的任务。一个算法的优劣可以用空间复杂度与时间复杂度来衡量。
一个算法应该具有以下五个重要的特征:
算法设计的要求:
1.算法程序无语法错误;
2.算法程序对于合法的输入产生满足要求的输出;
3.对于非法输入能够产生满足规格的说明;
4.算法程序对于故意***难的测试输入都有满足要求的输出结果。
事后统计方法:主要是通过设计好的测试程序和数据,利用计算机计时器对不同算法编制的程序的运行时间进行比较,从而确定算法效率的高低,但这种方法有很大缺陷,一般不予采纳。
事前分析估算方法:在计算机程序编制前,依据统计方法对算法进行估算。
一个用高级语言编写的程序在计算机上运行时所消耗的时间取决于以下因素:
定义:在进行算法分析时,语句总的执行次数T(n)是关于问题规模n的函数,进而分析T(n)随n的变化情况并确定T(n)的数量级。算法的时间复杂度,也就是算法的时间量度,记作:T(n}=0(f(n))。它表示随问题规模n的增大,算法执行时间的埔长率和 f(n)的埔长率相同,称作算法的渐近时间复杂度,简称为时间复杂度。其中f( n)是问题规横n的某个函数。
根据定义,求解算法的时间复杂度的具体步骤是:
⑴ 找出算法中的基本语句;
算法中执行次数最多的那条语句就是基本语句,通常是最内层循环的循环体。
⑵ 计算基本语句的执行次数的数量级;
只需计算基本语句执行次数的数量级,这就意味着只要保证基本语句执行次数的函数中的最高次幂正确即可,可以忽略所有低次幂和最高次幂的系数。这样能够简化算法分析,并且使注意力集中在最重要的一点上:增长率。
⑶ 用大Ο记号表示算法的时间性能。
将基本语句执行次数的数量级放入大Ο记号中。
如何推导大o阶呢?下面是基本的推导方法:
1.用常数1取代运行时间中的所有加法常数。
2.在修改后的运行次数函数中,只保留最髙阶项。
3.如果最高阶项存在且不是1,则去除与这个项相乘的常数。
简单的说,就是保留求出次数的最高次幂,并且把系数去掉。 如T(n)=n2+n+1 =O(n2)
######复杂度O(1) print("this is wd") ######复杂度O(n) for i in range(n): print(i) ######复杂度O(n2) for i in range(n): for j in range(n): print(j) ######复杂度O(n3) for i in range(n): for j in range(n): for k in range(n): print('wd') ######复杂度O(log2n) while n > 1: print(n) n = n // 2
常见的复杂度按效率排序:O(1)<O(logn)<O(n)<O(nlogn)<O(n2)<O(2nlogn)<O(n2)
空间复杂度(Space Complexity)是对一个算法在运行过程中临时占用存储空间大小的量度。一个算法在计算机存储器上所占用的存储空间,包括存储算法本身所占用的存储空间,算法的输入输出数据所占用的存储空间和算法在运行过程中临时占用的存储空间这三个方面。算法的输入输出数据所占用的存储空间是由要解决的问题决定的,是通过参数表由调用函数传递而来的,它不随本算法的不同而改变。存储算法本身所占用的存储空间与算法书写的长短成正比,要压缩这方面的存储空间,就必须编写出较短的算法。算法在运行过程中临时占用的存储空间随算法的不同而异,有的算法只需要占用少量的临时工作单元,而且不随问题规模的大小而改变,这种算法是节省存储的算法;有的算法需要占用的临时工作单元数与解决问题的规模n有关,它随着n的增大而增大,当n较大时,将占用较多的存储单元。
如当一个算法的空间复杂度为一个常量,即不随被处理数据量n的大小而改变时,可表示为O(1);当一个算法的空间复杂度与以2为底的n的对数成正比时,可表示为0(log2n);当一个算法的空间复杂度与n成线性比例关系时,可表示为0(n).若形参为数组,则只需要为它分配一个存储由实参传送来的一个地址指针的空间,即一个机器字长空间;若形参为引用方式,则也只需要为其分配存储一个地址的空间,用它来存储对应实参变量的地址,以便由系统自动引用实参变量。
效率:O(n2)
原理:
demo:
def bubble_sort(data): """ 冒泡排序 :param data: :return: """ for i in range(len(data)-1): # 趟数 for j in range(len(data)-i-1): # 遍历数据,依次交换 if data[j]>data[j+1]: # 当较大数在前面 data[j],data[j+1]=data[j+1],data[j] #交换两个数的位置 if __name__=='__main__': import random data_list=list(range(30)) random.shuffle(data_list) print("pre:",data_list) bubble_sort(data_list) print("after:",data_list) #结果: #pre: [22, 11, 19, 16, 12, 18, 20, 28, 27, 4, 21, 10, 9, 7, 1, 6, 5, 29, 8, 0, 17, 26, 13, 14, 15, 24, 25, 23, 3, 2] #after: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29]
优化版本:当某一趟走完以后发现并没有进行数据交换,那么此时的数列已经排列好了,没有必要在进行下去。例如:极端情况下,数列本来已经排序好的,我们只需要走一趟即可完成排序。
def bubble_sort(data): """ 冒泡排序优化版 :param data: :return: """ for i in range(len(data)-1): # 趟数 exchange=False # 交换标志 for j in range(len(data)-i-1): # 遍历数据,依次交换 if data[j]>data[j+1]: # 当较大数在前面 data[j],data[j+1]=data[j+1],data[j] # 交换两个数的位置 exchange = True # 改变标志 if not exchange: # 如果某一趟没有进行交换,代表排序完成 break return i # 返回次数的趟数 if __name__=='__main__': data_list=list(range(30)) print("pre:",data_list) num =bubble_sort(data_list) print("after:",data_list,'趟数:',num+1) #结果: #pre: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29] #after: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29] 趟数: 1
效率:O(n2)
原理:
demo:
def select_sort(data): """ 选择排序 :param data: 待排序的数据列表 :return: """ for i in range(len(data)-1): #趟数 min_index=i # 记录i趟开始最小的数的索引,我们从最左边开始 for j in range(i+1,len(data)): # 每一次趟需要循环的次数 if data[j] < data[min_index]: # 当数列中的某一个数比开始的数要小时候,更新最小值索引位置 min_index=j data[i],data[min_index]=data[min_index],data[i] # 一趟走完,交换最小值的位置,第一趟最小 if __name__=='__main__': import random data_list=list(range(30)) random.shuffle(data_list) # 打乱列表数据 print("pre:",data_list) select_sort(data_list) print("after:",data_list) #结果: #pre: [20, 11, 22, 0, 18, 21, 14, 19, 7, 23, 27, 29, 24, 4, 17, 15, 5, 10, 26, 13, 25, 1, 8, 16, 3, 9, 2, 28, 12, 6] #after: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29]
效率:O(n2)
原理:
demo:
def insert_sort(data): """ 插入排序 :param data: 待排序的数据列表 :return: """ for i in range(1, len(data)): # 无序区域数据 tmp = data[i] # 第i次插入的基准数 for j in range(i, -1, -1): if tmp < data[j - 1]: # j为当前位置,试探j-1位置 data[j] = data[j - 1] # 移动当前位置 else: # 位置确定为j break data[j] = tmp # 将当前位置数还原 if __name__=='__main__': import random data_list=list(range(30)) random.shuffle(data_list) # 打乱列表数据 print("pre:",data_list) insert_sort(data_list) print("after:",data_list) #结果: #pre: [7, 17, 10, 16, 23, 24, 13, 11, 2, 5, 15, 29, 27, 18, 4, 19, 1, 9, 3, 21, 0, 14, 12, 25, 22, 28, 20, 6, 26, 8] #after: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29]
效率:平均O(nlogn)
原理:
demo:
#!/usr/bin/env python3 #_*_ coding:utf-8 _*_ #Author:wd def quick_sort(data,left,right): """ 快速排序 :param data: 待排序的数据列表 :param left: 基准数左边元素的索引 :param right: 基准数右边元素的索引 :return: """ if left < right: mid = partition(data,left,right) # 分区操作,mid代表基数所在的索引 quick_sort(data,left,mid-1) # 对基准数前面进行排序 quick_sort(data,mid+1,right) # 对基准数后面进行排序 def partition(data,left,right): tmp=data[left] # 随机选择的基准数,从最左边开始选 while left < right: while left < right and data[right] >= tmp: # 右边的数比基准数大 right-=1 # 保留该数,然后索引指针往左移动 data[left]=data[right] # 否则此时右边数比基数小,则将该数放到基准位置 while left < right and data[left] <= tmp: # 右边的数比基准数小 left+=1 # 此时保持该数位置不动,索引指针往前移动 data[right]=data[left] # 否则此时左边的数比基数大,则将该数放到右边 data[left] = tmp # 最后将基准数量放回中间 return left # 返回基准数位置 if __name__=='__main__': data_list=[1,3,21,6,50,33,34,58,66] quick_sort(data_list,0,len(data_list)-1) print(data_list) ###结果:[1, 3, 6, 21, 33, 34, 50, 58, 66]
堆定义:本质是一个完全二叉树,如果根节点的值是所有节点的最小值称为小根堆,如果根节点的值是所有节点的最大值,称为大根堆。
效率:O(nlogn)
原理:
demo:
def sift(data, low, high): """ 调整堆函数 :param data: 带排序的数据列表 :param low: 值较小的节点的位置,可以理解为是根节点 :param high:值较大的节点的位置 :return: """ i = low j = 2 * i # 父节点i所对应的左孩子 tmp = data[i] # 最较小节点的值 while j <= high: if j < high and data[j] < data[j + 1]: # 如果右孩子比左孩子大则把j指向右节点 j += 1 # 指向右节点 if tmp < data[j]: # 如果此时位置较小的节点值比该节点值小,则将该节点上浮最为新的父节点,并调整该节点双亲 data[i] = data[j] i = j # 调整该节点的双亲的位置 j = 2 * i else: break # 否则代表本次调整已经完成,并且节点i已经无值 data[i] = tmp # 最后将被调整节点的值放到i节点上(空出的位置) def heap_sort(data): """ 堆排序 :param data: 待排序的数据列表 :return: """ n = len(data) for i in range(n // 2 - 1, -1, -1): sift(data, i, n - 1) # 构建堆 for i in range(n - 1, -1, -1): # 调整过程,从最后一个元素开始交换 data[0], data[i] = data[i], data[0] # 交换 sift(data, 0, i - 1) # 开始调整 if __name__ == '__main__': import random data_list = [1, 3, 21, 6, 50, 33, 34, 58, 66] random.shuffle(data_list) # 打乱列表数据 print("pre:", data_list) heap_sort(data_list) print("after:", data_list) #结果: #pre: [66, 3, 58, 34, 1, 33, 21, 6, 50] #after: [1, 3, 6, 21, 33, 34, 50, 58, 66]
效率:O(nlogn)
空间复杂度:O(n)
原理:
demo:
def merge(data, low, mid, high): """ 合并函数 :param data: 数据列表 :param low: 列表开头位置 :param mid: 分割中间位置 :param high: 列表最后位置 :return: """ i = low # 第一个指针 j = mid + 1 # 第二个指针 tmp = [] # 临时存放的列表 while i <= mid and j <= high: # 分割的列表当两边都有数才进行 if data[i] < data[j]: tmp.append(data[i]) i += 1 # 低的指针往右移动 else: tmp.append(data[j]) # 右边大,存右边的数 j += 1 # 同时指针右移动 while i <= mid: # 左边分割有剩下 tmp.append(data[i]) i += 1 while j <= high: # 右边有剩下 tmp.append(data[j]) j += 1 data[low:high + 1] = tmp # 最后将tmp中的数写入到原来的列表中 def merge_sort(data, low, high): """ 归并排序 :param data: 待排序的数据列表 :param low: 数据列表开始位置 :param high: 数据列表结束位置 :return: """ if low < high: # 至少有两个元素才进行 mid = (low + high) // 2 # 分割 merge_sort(data, low, mid) # 递归分割上一部分 merge_sort(data, mid + 1, high) # 递归分割下一部分 merge(data, low, mid, high) # 合并 if __name__ == '__main__': import random data_list = [1, 3, 21, 6, 50, 33, 34, 58, 66] random.shuffle(data_list) # 打乱列表数据 print("pre:", data_list) merge_sort(data_list, 0, len(data_list) - 1) print("after:", data_list) #结果: #pre: [21, 3, 33, 58, 34, 66, 1, 6, 50] #after: [1, 3, 6, 21, 33, 34, 50, 58, 66]
效率:与增量有关,O(n1+£)其中<0£<1,如增量为2k-1 复杂度为O(n3/2)
原理:
def shell_sort(data): """ 希尔排序 :param data:待排序的数据列表 :return: """ d1 = len(data) // 2 # 设置分割大小为d1, while d1 > 0: for i in range(d1, len(data)): tmp = data[i] # 当前分割元素位置 j = i - d1 # 上一个分割元素位置 while j >= 0 and tmp < data[j]: # 上一个元素分割位置比当前分割位置要大,则需要调整位置 data[j + d1] = data[j] # 后移动当前分割元素位置 j -= d1 # 往前移d1 data[j + d1] = tmp d1 //= 2 # 继续分割 if __name__ == '__main__': import random data_list = [1, 3, 21, 6, 50, 33, 34, 58, 66] random.shuffle(data_list) # 打乱列表数据 print("pre:", data_list) shell_sort(data_list) print("after:", data_list) #结果: #pre: [3, 66, 58, 34, 33, 50, 6, 21, 1] #after: [1, 3, 6, 21, 33, 34, 50, 58, 66]