基于辅助学习与富信息策略的Tri-training算法.pdf
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 辅助 学习 信息 策略 Tri training 算法
- 资源描述:
-
第31卷第9期
计算机应用研究
2014年9月
A pplication Rreseareth of Computers
ep.2014
基于辅助学习与富信息策略的 Tri-training算法
往龙杰?,+:红丽,律宋
延边大学a.计算杌科学与技术系智能信息处理研究室;h.财务处,吉林延古133002:2.山东优加利信息
技术有限公司,济南250101
摘要:针对Ti- -tralning算法利用无标记样例时会引入弊声且限制无标记样例的利用率而导致分性能下降
的缺点,提出了AR-Ti- Raining(Tni- training with assistant and rich strategy)算法。提出助学?策略,鈷合富信息
策略设计趵学刁繄,并将辅勁学刁器应用在 Iri-lrailuing训练以及说话声识中,实验结果表明,繍助学刁器
在Ti- training训练的基础上不仅降低每次达代可能产生的误标记样例激,而F能够充分地利用无标样例以及
在验讵案上的嵽分样例信息。从实验结果可以得出,该算法能够弥祁Tri- Taining算法的缺点,进一岁捉高测
关键词:半监督学习;富信息策略;鞘助学刁策略;Ti- -training;说污声识列
中图分类号:I391.41:I301.6
文献标志码:A
文章编号:1001-3695(2014)09-2685-03
loi:10.3969/f.issn.1001-3695.2014.09.029
Ar-tri-training: Tri-training with assistant and rich information strategy
CUI Long-jie", WAM( Ilong-, CLI Rong-yi
(1.at.neligerilnyfonratiorP?uesiaxLrborgtory,Depu,yComyuerScieueeZTeeoelvgy.b.FinaeialDepurtnere,TarnbietLiriersig
Yer Jilin 133002. in 2. Shun ul Inform eh y Ce. nn 230101, i y
Abstract: Tri-training introdluced noise samples and restricted the util: zation of unlabeled samples for the use of unlabeled
samples, so the classification performance of the classifier decreased. Ihis paper roposed a new Iri-training style algorithm
named Ar-iri-train ng (iri-training with as istant and rich stratey ) Firstly, it presented the assistant learning stratey. e
ondy, it designed the supporting learner by combining the assistant learning strategy with rich information strategy. I nally
lhe training process of Tri-lraining and voice recognition applied the supporting learner. The experinental results siow thal LI
supporting learner not only reduces the number of mislabeled samples produced in the iterations based on Iri-training, but also
makes full wse of the Unlabeled amles nd the miselassified simples f vation set. It ean be drawn from the eperimental
results that Ar-tri-training algoritm can compensate for the shorteomings of Tr traning algorithm, furter improve the testing
Key words: semisupervised learning: rich information strategys assistant leamning strategy; Iri-trainng: vice recog itio
属性了集都能独立训练出学习器,这在实际问题中很非满
0引言
足。为此, rollman等人们是出·种收进的
ng算法
传筑的监督学习需耍一組足够多的山标记样例作为训练其不受属性集划分的约東,川用將个属性集训练两个学习器,
集,否则无法状得足够泛化性能的监督学习方法。而在实际应
但要求两个学习器所用的监督学习算法能够将实例空间刘分
用山,得到大量标记样例是非常难的,甚全尢法实地;前尢監
为等价类集合,而二.训练过程需要使月耗时的交叉验证作
督学习试图通过发现末标汇例中的隐含结构,从构造出相決定。 Tri-lraunung算法是Z?ou等人提出的种新的Co
的学习器,这导致无监督学习通常很傩保证较的学习精
trainig模式半佐督分类算法,它使用三个学习进行训练,其
形式为:任意两个学习器组成联合学习迭代地对无标记栏例倒
度。因此,将少量帯标记例利人量尤标記柠例編令的半监管标迅形成第三个学习器的断訓练築,并重断训、。与标推Co-
学习成为机学习研究热点
rully算法和 Goldran的改进算法柑比,Tri- rallllriu算法对属
山前,心"泛研究的半监督分类算法是从随督学引角度出性集和三个学习器所用的监督学习算法都没有约東、而「不使
发,考虑带标记训练例不是时,知何利用大ん标记样例信用耗时的交义验证,因此还用范団更广、效率更高
包辅助学可器训练。lum等人·提出的Co- trainig算法是
同其他半监督学习方法所遇到的阿一、由于迭代学习
种半監督学习范理。该算法独立地训两个学习,然斤采过程中无标记样例常被错误地标记并积累而损害学习性能的
用互助方式迭代地扩元帯怀记栏例集并承新训练。标Co-提高,这在 Tri-training和其他 Co-training模式的半监督学
ing算法芸求属性集能够划分为两个不相交的子集,上每习中更芦重心。因此,本文提出一-利能够降低误标记差诃数
收稿日期:2013-08-27;修回日期:2013-10-24基金项目:吉林省育片“+二?”科学技术研究项J(去科合[20111第
作者简介;た(1970-)、另,吉林吉人、エ程師、硕士,主要研究方向为人エ神經脚終、候式识別;紅丽(1983-),女,山西临汾人,算法エ
样师,上、主要研究ブ向为模式识別;崔栄--(1962-),努(通信作者),吉淋延吉人,教授,导,博北,主要研究方向为漢式识別、客能汁等(cu
hongyi( vhu. cr. cn)
万方数据
展开阅读全文
文档分享网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。



链接地址:https://www.wdfxw.net/doc65482439.htm