量子梯度下降算法有了改进方案~化繁为简,兼容
作者 |郑金武
大道至简,简而不凡。
在物理学上,有许多模型都可以用简洁的公式来表示,质能方程(E=mc2)、牛顿第二定律(F=ma)等,一目了然又意义非凡。
随着量子技术的快速发展,为量子计算机开发简洁高效的算法或软件,成为众多科学家孜孜以求的梦想。近日,北京量子信息科学研究院(以下简称“北京量子院”)兼聘研究员、清华大学教授龙桂鲁团队在量子算法改进方面再下一城。
龙桂鲁团队将之前的“量子梯度下降算法”作了进一步改进提升,极大降低了该算法对量子线路等资源的需求;该算法在复杂的高维数据的优化方面,明显超过经典算法,并能兼容于未来的量子计算机。相关成果于1月29日发表在Nature子刊《量子信息期刊》上。
梯度下降算法困局
梯度下降算法是传统的数值最优化计算的核心之一,也是当前人工智能领域众多机器学习算法的重要部分。
“梯度下降算法的基本思想,可以类比为一个下山的过程,即从山顶不断向下寻找谷底。”龙桂鲁告诉《中国科学报》。
可以假设这样一个场景:一个人被困在山上,需要从山上下来,但此时山上的浓雾很大,导致能见度很低,因此下山的路径就无法确定,他必须利用自己周围的信息去找到下山的路径。这时,他以当前所处的位置为基准,寻找这个位置最陡峭的地方,然后朝着山的高度下降的地方走;每走一段距离到一个低点后,他都反复采用同一个方法,实现“梯度下降”,最后就能成功到达谷底。
同理,如果我们的目标是上山,也就是爬上山顶,那么此时就可以寻找最陡峭的方向往上走,到达一个高点后,反复采用同一方法,最终也能到达山顶。
龙桂鲁介绍,梯度下降算法的基本思想就是通过不断迭代,即类似于“反复找陡坡下山”,使目标函数沿着最优梯度方向演化,从而找到目标函数的局部最小值。
然而,“对于图像数据、遥感探测数据、机器学习等这些数据规模极大的高维数据,在其最优化问题中,采用梯度下降算法时,往往需要消耗大量的计算资源;甚至以目前的经典计算能力,很可能难以解决某些高维数据的优化问题。”论文作者之一、北京量子院博士后魏世杰告诉《中国科学报》。
“这就像下山时,找最陡峭的山坡并不是一件容易的,需要结合多种工具或测量手段,才能确定一个方向是最陡峭方向。”龙桂鲁说。
算法迎来量子“加持”
而量子技术的发展,为突破这个困局带来了曙光。
此前,有研究人员结合量子计算的优势,提出了量子版本的梯度下降算法。
在量子梯度下降算法中,采用了一种实用且基础的量子算法——量子相位估计方法。但这种方法在面对超大规模的数据计算时,所需的量子比特数量就越多,因而对量子信息储存单元(例如量子位元)进行各种操作形成的“量子线路”深度就越大。
“量子线路是由量子比特和量子门组成,对量子比特的一次控制操作就是一个量子门。量子线路就像五线谱一样,量子比特是谱线,音符就是量子门。一个特定算法对应的特定量子线路,通过‘一首五线谱曲'来完成计算任务。”魏世杰介绍,在现有的量子计算机条件下,量子门操作还存在比较大的误差,对于深度较大的量子线路往往难以完成精准的计算。此前版本的量子梯度下降算法需要深度较大的量子线路,因此无法在现有的量子计算机系统上运行。
龙桂鲁团队提出了改进版本的量子梯度下降算法,使得该量子算法可以在现有的量子计算机系统上运行。
早在2002年,龙桂鲁就提出了酉算子线性组合(LCU)。此前,科学家们提出的量子计算模型中,只允许酉算子进行乘除运算。而酉算子线性组合则突破了这种限制,酉算子不仅可以进行乘除运算,还可进行加减运算,大大提升了量子计算的效力和可扩展性。
利用酉算子线性组合(LCU)方法,龙桂鲁团队发展了量子梯度下降算法,并给出了量子线路表示。“相当于给出了量子比特操作的‘示意图'。”魏世杰介绍。
在龙桂鲁团队的量子梯度下降算法中,量子态所需拷贝的数量,从多项式数目量级减少为与系统大小无关的常数2。魏世杰表示:“以往计算中需要拷贝的量子态数量,规模极其巨大,是多项式数目量级的,而我们的算法中,只需要拷贝2个量子态。”
这一改进,大幅度降低了量子线路的深度,使得量子门操作数目也随之大幅减少,从而可以在现有的量子比特数量有限的量子计算机上运行量子梯度下降算法。