《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 設(shè)計(jì)應(yīng)用 > 基于強(qiáng)化學(xué)習(xí)的特征工程算法研究
基于強(qiáng)化學(xué)習(xí)的特征工程算法研究
2021年電子技術(shù)應(yīng)用第7期
謝 斌1,2,林珊玲2,3,林志賢1,2,郭太良1,2
1.福州大學(xué) 物理與信息工程學(xué)院,福建 福州350116; 2.中國(guó)福建光電信息科學(xué)與技術(shù)創(chuàng)新實(shí)驗(yàn)室,福建 福州350116;3.福州大學(xué) 先進(jìn)制造學(xué)院,福建 泉州362200
摘要: 特征工程可以自動(dòng)地處理和生成那些判別性高的特征,而無需人為的操作。特征工程在機(jī)器學(xué)習(xí)中是不可避免的一環(huán),也是至關(guān)重要的一環(huán)。提出一種基于強(qiáng)化學(xué)習(xí)(RL)的方法,將特征工程作為一個(gè)馬爾可夫決策過程(MDP),在上限置信區(qū)間算法(UCT)的基礎(chǔ)上提出一個(gè)近似的方法求解二分類數(shù)值數(shù)據(jù)的特征工程問題,來自動(dòng)獲得最佳的變換策略。在5個(gè)公開的數(shù)據(jù)集上驗(yàn)證所提出方法的有效性,F(xiàn)Score平均提高了9.032%,同時(shí)與其他用有限元變換進(jìn)行特征工程的方法進(jìn)行比較。該方法確實(shí)可以得到判別性高的特征,提高模型的學(xué)習(xí)能力,得到更高的精度。
中圖分類號(hào): TP391
文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.201173
中文引用格式: 謝斌,林珊玲,林志賢,等. 基于強(qiáng)化學(xué)習(xí)的特征工程算法研究[J].電子技術(shù)應(yīng)用,2021,47(7):29-32,43.
英文引用格式: Xie Bin,Lin Shanling,Lin Zhixian,et al. Research on feature engineering algorithm based on reinforcement learning[J]. Application of Electronic Technique,2021,47(7):29-32,43.
Research on feature engineering algorithm based on reinforcement learning
Xie Bin1,2,Lin Shanling2,3,Lin Zhixian1,2,Guo Tailiang1,2
1.School of Physics and Information Engineering,F(xiàn)uzhou University,F(xiàn)uzhou 350116,China; 2.China Fujian Optoelectronic Information Science and Technology Innovation Laboratory,F(xiàn)uzhou 350116,China; 3.School of Advanced Manufacturing, Fuzhou University,Quanzhou 362200,China
Abstract: Feature engineering can automatically process and generate those highly discriminative features without human operation. Feature engineering is an inevitable and crucial part of machine learning. The article proposes a method based on reinforcement learning(RL), taking feature engineering as a Markov decision process(MDP), and proposes an approximate method based on the upper limit confidence interval algorithm(UCT) to solve the feature engineering of binary numerical data problem to automatically obtain the best transformation strategy. The effectiveness of the proposed method is verified on five public data sets. The FScore of the five public data sets is improved by an average of 9.032%. It is also compared with other papers that use finite element transformation for feature engineering. This method can indeed obtain highly discriminative features, improve the learning ability of the model, and obtain higher accuracy.
Key words : feature engineering;reinforcement learning;machine learning

0 引言

    機(jī)器學(xué)習(xí)廣泛應(yīng)用于人們的日常生活中,其中預(yù)測(cè)分析廣泛應(yīng)用于多個(gè)領(lǐng)域的決策,包括欺詐檢測(cè)[1-2]、在線廣告[3-4]、風(fēng)險(xiǎn)管理、市場(chǎng)營(yíng)銷等。預(yù)測(cè)模型是采用監(jiān)督學(xué)習(xí)算法來進(jìn)行預(yù)測(cè),通過歷史數(shù)據(jù)進(jìn)行訓(xùn)練分類或者回歸模型來預(yù)測(cè)未知的結(jié)果,以起到?jīng)Q策的作用。數(shù)據(jù)的表示方法對(duì)于模型的準(zhǔn)確度十分重要,原始的數(shù)據(jù)空間往往難以表達(dá)數(shù)據(jù)。因此,在模型構(gòu)建之前對(duì)數(shù)據(jù)進(jìn)行適當(dāng)?shù)奶幚砑稗D(zhuǎn)換是必不可少的。

    特征工程的主要目的就是改變預(yù)測(cè)建模的特征以更好地適應(yīng)算法的訓(xùn)練,通過生成那些判別性高的特征來提高模型訓(xùn)練的準(zhǔn)確度。在現(xiàn)實(shí)中,特征工程是由數(shù)據(jù)科學(xué)家手動(dòng)和根據(jù)領(lǐng)域知識(shí)來進(jìn)行的,這一過程往往是十分繁瑣且耗時(shí)的[5],而且很容易產(chǎn)生錯(cuò)誤和偏差。




本文詳細(xì)內(nèi)容請(qǐng)下載:http://m.xxav2194.com/resource/share/2000003649




作者信息:

謝  斌1,2,林珊玲2,3,林志賢1,2,郭太良1,2

(1.福州大學(xué) 物理與信息工程學(xué)院,福建 福州350116;

2.中國(guó)福建光電信息科學(xué)與技術(shù)創(chuàng)新實(shí)驗(yàn)室,福建 福州350116;3.福州大學(xué) 先進(jìn)制造學(xué)院,福建 泉州362200)




wd.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。
主站蜘蛛池模板: 大炕上农村岳的乱| 3751性欧美视频在线播放| 欧美激情视频网| 国产午夜激无码av毛片| 999久久久免费精品播放| 无翼乌全彩我被闺蜜男口工全彩| 国产在线高清精品二区| qvod激情小说| 日本邪恶全彩工囗囗番3d| 亚洲最大成人网色香蕉| 精品国产第一国产综合精品| 国产成人综合久久精品红| 99久热任我爽精品视频| 我和小雪在ktv被一群男生小说| 亚洲色图第1页| 色吊丝av中文字幕| 国产热の有码热の无码视频| av72发布页| 日本三级欧美三级人妇视频黑白配| 伊人久久亚洲综合| 色噜噜狠狠色综合欧洲| 国产理论视频在线观看| 99精产国品一二三产| 成年女人毛片免费视频| 久久青草精品38国产| 欧美精品第1页在线播放| 制服丝袜怡红院| 野战爱爱全过程口述| 国产精品福利一区二区| www.狠狠插| 新梅金瓶之爱奴1国语在线观看| 亚洲欧美成aⅴ人在线观看| 精品少妇ay一区二区三区| 国产在线一区二区三区av| 8x网站免费入口在线观看| 婷婷久久久五月综合色| 久久久久777777人人人视频| 果冻传媒和精东影业在线观看| 又大又粗又爽a级毛片免费看| 182tv午夜线路一线路二| 好男人在线视频www官网|