2020人工智能技术应用精选合集.docx

上传人:王** 文档编号:835502 上传时间:2024-01-23 格式:DOCX 页数:96 大小:1.04MB
下载 相关 举报
2020人工智能技术应用精选合集.docx_第1页
第1页 / 共96页
2020人工智能技术应用精选合集.docx_第2页
第2页 / 共96页
2020人工智能技术应用精选合集.docx_第3页
第3页 / 共96页
2020人工智能技术应用精选合集.docx_第4页
第4页 / 共96页
2020人工智能技术应用精选合集.docx_第5页
第5页 / 共96页
2020人工智能技术应用精选合集.docx_第6页
第6页 / 共96页
2020人工智能技术应用精选合集.docx_第7页
第7页 / 共96页
2020人工智能技术应用精选合集.docx_第8页
第8页 / 共96页
2020人工智能技术应用精选合集.docx_第9页
第9页 / 共96页
2020人工智能技术应用精选合集.docx_第10页
第10页 / 共96页
亲,该文档总共96页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《2020人工智能技术应用精选合集.docx》由会员分享,可在线阅读,更多相关《2020人工智能技术应用精选合集.docx(96页珍藏版)》请在优知文库上搜索。

1、2020人工智能技术应用精选合集2018年伊始,万众期待的人工智能学术会议AAAI2018在华人春节前一周正式召开,这也标志着全球学术会议新一年的开启。作为一个已举办32届的成熟会议,AAAI不仅因其理论性与应用性交织的特点被中国计算机学会(CCF)推荐为人工智能A类会议,更凭借高质量的论文录用水准成为国内高校及研究机构乃至全球学者们密切关注的学术会议。AAAI2018拘嫡3808篇投递论文,相较往年提升了47%;而今年的录用论文数共有938篇,录用率与上年持平,约为24.6%o来自中国的论文投递数在今年有了巨大提升,在AAAI2018上共收到1242篇论文投稿,并有785篇论文被录用。录用论

2、文现场报告阿里巴巴在AAAl2018上也收获了11篇录用论文,分别来自DST、业务平台事业部、阿里妈妈事业部、人工智能实验室、云零售事业部,其中有5位作者受邀在主会做Orai形式报告,另有1位作者携两篇论文在主会以Poster形式做报告。论文内容涉及对抗学习、神经网络、提高轻量网络性能的训练框架、聊天机器人、无监督学习框架、极限低比特神经网络等技术方向。目录-FPL:线性时间的约束容忍分类学习算法1基于注意力机制的用户行为建模框架及其在推荐领域的应用9极限低比特神经网络:通过ADMM算法进行极限压缩17一种基于词尾预测的提高英俄翻译质量的方法22火箭发射:一种有效的轻量网络训练框架30句法敏感

3、的实体表示用于神经网络关系抽取39一种利用用户搜索日志进行多任务学习的商品标题压缩方法43基于对抗学习的众包标注用于中文命名实体识别50CoChat:聊天机器人人机协作框架55阿里巴巴AAAl论文COLink:知识图谱实体链接无监督学习框架74层叠描述:用于图像描述的粗略到精细学习83-FPL:线性时间的约束容忍分类学习算法-FPL:Tolerance-ConstrainedLearninginLinearTime摘要许多实际应用需要在满足假阳性率上限约束的前提下学习一个二分类器。对于该问题,现存方法往往通过调整标准分类器的参数,或者引入基于领域知识的不平衡分类损失来达到目的。由于没有显式地将

4、假阳性率上限融合到模型训练中,这类方法的精度往往受到制约。本文提出了一个新的排序-阈值方法-FPL解决这个问题。首先,我们设计了一个新的排序学习方法,其显式地将假阳性率上限值纳入考虑,并且展示了如何高效地在线性时间内求得该排序问题的全局最优解:而后将学到的排序函数转化为一个低假阳性率的分类器。通过理论误差分析以及实验,我们验证了-FPL对比传统方法在性能及精度上的优越性。研究背景在疾病监测,风险决策控制,自动驾驶等高风险的分类任务中,误报正样本与负样本所造成的损失往往是不同的。例如,在高死亡率疾病检测的场景下,遗漏一名潜在病人的风险,要远高于误诊一名正常人。另一方面,两类错误的损失比也很难量化

5、估计。在这种情况下,一个更加合理的学习目标是:我们希望可以在保证分类器假阳性率(即错误地将负样本分类为正样本的概率)低于某个阈值的前提下,最小化其误分正样本的概率。可以看到,由于问题的转换,传统的基于精度(Accuracy),曲线下面积(AUC)等目标的学习算法将不再适用。假阳性率约束下的分类学习,在文献中被称为Neyrnan-Pearson分类问题。现存的代表性方法主要有代价敏感学习(COSt-SenSitiVeIearning),拉格朗H交替优化(LagragianMethod),排序-阈值法(Ranking-Thresholding)等。然而,这些方法通常面临一些问题,限制了其在实际中的

6、使用:1 .需要额外的超参数选择过程,难以较好地匹配指定的假阳性率;2 .排序学习或者交替优化的训练复杂度较高,难以大规模扩展;3 .通过代理函数或者罚函数来近似约束条件,可能导致其无法被满足。因此,如何针对现有方法存在的问题,给出新的解决方案,是本文的研究目标。动机:从约束分类到排序学习考虑经验版本的Neyman-Pearson分类问题,其寻找最优的打分函数f与阈值b,使得在满足假阳性率约束的前提下,最小化正样本的误分概率:minJ2H()b)丁(1)f.bm2-rnz-zj=1J=I我们尝试消除该问题中的约束。首先,我们阐述一个关键的结论:经验Neyman-Pearson分类与如下的排序学

7、习问题是等价的,即它们有相同的最优解f以及最优目标函数值:咿嬴E11(/(靖)7(/.)do4:计算g()在,4)处的梯度5:梯度下降,得到M+4+6:投影M+1,0I+1到可行域底上:(tt+lA+)4-11,(t+t+)?:更新计数器:-+1;8:endwhile9:RenimwU 0kJ*OUrBiM01outs,t三0.01ours.Olour*.-PTkC1UOOOI-PTC,I=001-F11(C.UO-IPThC.02图2我们的方法与现存算:法(PTkC)在求解简化版问题时的性能对比(Iog-Iog曲线)阈值选择阈值选择阶段,算法每次将训练集分为两份,一份训练排序函数,另一份用来

8、选取阈值。该过程可以进行多次,以充分利用所有样本,最终的阈值则是多轮阈值的平均。该方法结合了OULOf-bo。ISlraP与软阈值技术分别控制偏差及方差的优点,也适于并行。理论结果收敛率与时间复杂度通过结合加速梯度方法与线性时间投影算法,t-FPL可以确保每次迭代的线性时间消耗以及最优的收敛率。图3将-FPL与一些经典方法进行了对比,可以看到其同时具备最优的训练及验证复杂度。泛化性能保证我们也从理论上给出了-FPL学得模型的泛化误差界,证明了泛化误差以很高的概率被经验误差所上界约束。这给予了我们设法求解排序问题(2)的理论支持。算法训练复杂度交叉验证复杂度T-FPLO(m+n)rfT2)线性T

9、opPiishO(m+n)dT2)线性CS-SVMO(m+njdT)二次SVcO(tlogrn+nlogtt+GH+n)d)T)线性BipartiteO(m+n)d十(/十n)log(m+n)T)线性RankingOnnd+HHilog(r)/VT)图3不同算法的训练更杂度比较实验结果IwartI20/1504BI8IV27M57rvHMm2225007U:209582930627674:5007(%)5IO0.1U515100.01I5100.05aas1510CSSMIopruxli.526Ml.691.711.109.112.302.303.47.4M.811.TH.920.M5.376.391.748.747.921.920.112.96.99().於3.501.5Oe.520.551.M927.695.656X28.761.85.M2SVMd509.72N/ANN/AN/AM

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > IT计算机 > 人工智能

copyright@ 2008-2023 yzwku网站版权所有

经营许可证编号:宁ICP备2022001189号-2

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!