决策单调性详解_怎么求单调性

博客小编 (41) 2024-09-05 09:01:01

决策单调性充要条件

对于两个决策点，若在i处，大决策点优于小决策点,则在[i+1,n]处，大决策点都比小决策点优

证明时，无需数学证明，打表证明cost数组是“凸”即可
j<j+1<=i<i+1 证明cost数组
交叉小于包含

---------------------------------------------------------------------------------------------------------------------------------

1D1D动态规划优化

决策单调性详解_怎么求单调性 (https://mushiming.com/) 第1张

1D/1D 动态规划优化初步
所谓1D/1D 动态规划，指的是状态数为O(n)，每一个状态决策量为O(n)的动态规划方程。
直接求解的时间复杂度为O(n2)，但是，绝大多数这样的方程通过合理的组织与优化都是可
以优化到O(nlogn)乃至O(n)的时间复杂度的。这里就想讲一讲我对一些比较初步的经典的
优化方法的认识。
本文中不想进行过多的证明与推导，主要想说明经典模型的建立、转化与求解方法。
由于本人认识与水平相当有限，如果出现什么错误与疏漏，还请大牛多多指正。另外，也
希望大牛们更多地向我们介绍一下有关动态规划优化的更深入的东西。
本文中使用两种方式表示一个函数：f(x)与f[x]，用方括号表示的函数值可以在规划之前
全部算出（常量），而用圆括号表示的函数值必须在规划过程中计算得到（变量）。无论是什
么函数值一经确定，在以后的计算中就不会更改。

我们总是沿着“f(x)的最优决策是什么”这个思路进行思考，下面我们换一个角度，
思考对于一个已经计算出来的状态f(j)，“f(j)能够更新的状态有哪些”。这样，每一步过程中
某些状态的决策可能不是最优的，但是当算法结束的时候所有状态对应的决策一定是最优
的。
一开始，只有f(1)的函数值被计算出来，于是所有状态的当前最优决策都是1。

现在，显然f(2)的值已经确定了：它的最有决策只能是1。我们用决策2 来更新这个决策
表。由于决策单调性，我们知道新的决策表只能有这样的形式：

22222
这意味着我们可以使用二分法来查找“转折点”，因为如果在一个点x 上，如果决策2 更
好，则所有比x 大的状态都是决策2 更好；如果x 上决策1 更好，则所有比x 小的状态都是
决策1 更好。
现在决策1 和决策2 都已经更新完毕，则f(3)业已确定，现在用决策3 来更新所有状态。
根据决策单调性，现在的决策表只能有以下2 种类型：

而这样的决策表示绝对不会出现的：
22222，不可能。
那么，我们的更新算法就是：
1、考察决策2 的区间[b,e]的b 点上是否决策3 更优，如果是，则全部抛弃决策2，将此
区间划归决策3；如果否，则在决策2 的区间[b,e]中二分查找转折点。
2、如果第1 问的回答是“是”，则用同样的方法考察决策1。
推演到这一步，相信决策单调性的实现算法已经明了了：使用一个栈来维护数据，占中的
每一个元素保存一个决策的起始位置与终了位置，显然这些位置相互连接且依次递增。当插
入一个新的决策时，从后到前扫描栈，对于每一个老决策来说，做这样两件事：
1、如果在老决策的起点处还是新决策更好，则退栈，全额抛弃老决策，将其区间合并至
新决策中，继续扫描下一个决策。
2、如果在老决策的起点处是老决策好，则转折点必然在这个老决策的区间中；二分查找
之，然后新决策进栈，结束。
由于一个决策出栈之后再也不会进入，所以均摊时间为O(1)，但是由于二分查找的存在，
所以整个算法的时间复杂度为O(nlogn)。

noi2009a 诗人小G对应的1D1D动态规划优化分析

决策单调性详解_怎么求单调性 (https://mushiming.com/) 第2张

1 //不要去洛谷上面提交，洛谷的这题数据有问题，去codeVs 2 #include<cstdio> 3 #include<cstring> 4 #define ll long double 5 //node[i]代表i，里面的l代表决策的作用起点，r代表决策的作用终点，p是决策的值 6 struct node{int l,r,p;}q[]; 7 #define MAX 00000000LL 8 #define N  9 ll sum[N],f[N]; 10 int n,l,p,T; 11 char ch[35]; 12 //求|y|^p的函数 13 ll pow(ll y){ 14 if(y<0)y=-y; 15 ll ans=1; 16 for (int i=1;i<=p;i++) ans*=y; 17 return ans; 18 } 19 //计算不协调度 20 ll calc(int x,int y){ 21 return f[x]+pow(sum[y]-sum[x]+(y-x-1)-l); 22 } 23 //二分查找找决策转折点 24 //node表示老决策点，x表示新决策点的值 25 //这个函数就是在老的决策点的范围中寻找新的决策点的值 26 int find(node t,int x){ 27 int l=t.l,r=t.r; 28 while(l<=r){//当头小于等于尾，也就是还有数可以查找的时候 29 //mid=(头+尾)/2 30 int mid=(l+r)>>1; 31 //小于的情况，也就是新的决策点更有，我们就要一直往前继续扩展新的决策点的起点， 32 //直到老决策点比较好的时候 33 if (calc(x,mid)<=calc(t.p,mid)) r=mid-1; 34 //大于的情况，也就老决策点比较好的时候，我们往后搜索新决策点的作用域的起点 35 else l=mid+1; 36 } 37 //返回头 38 return l; 39 } 40 41 void dp(){ 42 //用数组模拟栈，头置为1，尾置为0 43 int head=1,tail=0; 44 //将第一个决策入栈，决策1的起点为0，终点为n，决策的初始值置为0，因为初始决策就是0 45 q[++tail]=(node){0,n,0}; 46 //求取f[i] 47 for (int i=1;i<=n;i++){ 48 //如果栈头结点上的决策作用终点小于i，说明这个决策已经无法对i进行作用，所以我们要换新的决策 49 //head<=tail栈的头小于等于尾，说明栈里面还有新的决策，那就换上新的决策 50 //因为head++，所以此时头节点是指向新的决策 51 if(q[head].r<i&&head<=tail) head++; 52 //用新的可以作用i位置的决策来计算f[i]的值，这样计算出来的f[i]的值就是最优值 53 f[i]=calc(q[head].p,i); 54 //calc(i,n)表示通过值为i的决策去计算f[n]的值 55 //calc(q[tail].p,n)表示通过旧决策q[tail].p去计算f[n]的值 56 //calc(i,n)<=calc(q[tail].p,n)表示值为i的决策优于老决策，我们才进行下一步 57 //不然，如果老决策更好，我们根部用不着换决策 58 59 //每一个被计算出来的f[i]，都会使i成为新的决策，因为我有了f[i]的值， 60 //所以我可以用f[i]的值帮助计算别的f[k](k>i)，所以f[i]就是新的决策 61 62 /* 63 比如说我们的样例1中，当i==3时，我们通过 q[head].p=2这个决策把f[3]算出来了 64 比如说这里的n是4，如果calc(3,4)<=calc(2,4)，那说明值为3的这个新决策更好， 65 我们就要在决策2的作用区间里面找出决策3的作用区间 66 */ 67 68 69 //如果新决策更好，找出新决策的作用范围 70 //确定新决策点的终点 71 if (calc(i,n)<=calc(q[tail].p,n)){ 72 //如果栈的头小于等于尾，head<=tail，说明栈里有元素 73 //calc(q[tail].p,q[tail].l)表示用旧决策点决策值来决策旧决策点的起点 74 //calc(i,q[tail].l)用新决策点来决策旧决策点的起点 75 //如果后者小于前者，说明新决更好，那就要在更广阔的范围里面去寻找新决策点的决策范围 76 //换句话说，就是当新决策点的作用范围覆盖了老决策点，我们要到比旧决策点更老点决策点里面寻找新决策点的作用方位 77 while(head<=tail&&calc(q[tail].p,q[tail].l)>=calc(i,q[tail].l)) tail--; 78 //head>tail说明栈已经为空了，就是说现在新决策点最好，所以把新决策点入栈 79 if(head>tail)q[++tail]=(node){i,n,i}; 80 else{ 81 //否则，我们就要去寻找新决策点的作用范围 82 //x返回新决策点范围的起点 83 int x=find(q[tail],i); 84 //旧决策点的尾部置为x-1 85 q[tail].r=x-1; 86 //将新决策点入栈 87 q[++tail]=(node){x,n,i}; 88 } 89 } 90 } 91 } 92 93 int main(){ 94 scanf("%d",&T); 95 while(T--){ 96 scanf("%d%d%d",&n,&l,&p); 97 for (int i=1;i<=n;i++) scanf("%s",ch),sum[i]=sum[i-1]+strlen(ch); 98 dp(); 99 if(f[n]>MAX) 100 puts("Too hard to arrange"); 101 else 102 printf("%lld\n",(long long)f[n]); 103 puts("--------------------"); 104 } 105 return 0; 106 }

THE END

发表回复

请先登录账户再评论哦

决策单调性详解_怎么求单调性

1D1D动态规划优化

HDLBits(八)学习笔记——Counters(计数器)

京东应急物资供应链管理平台_京东智慧供应链

vivadoltx文件_tcl脚本语言

什么是覆盖方法_表格怎么覆盖相同内容

推荐文章

Oracle的学习心得和知识总结（六）|Oracle数据库同义词技术详解

发表回复

热门文章

推荐文章

决策单调性详解_怎么求单调性

1D1D动态规划优化

HDLBits(八)学习笔记——Counters(计数器)

京东应急物资供应链管理平台_京东智慧供应链

vivadoltx文件_tcl脚本语言

什么是覆盖方法_表格怎么覆盖相同内容

推 荐 文 章

Oracle的学习心得和知识总结（六）|Oracle数据库同义词技术详解

发表回复

热门文章

推荐文章

推荐文章