久久这里只有精品国产99-久久这里只有精品2-久久这里只有精品1-久久这里只精品热在线99-在线少女漫画-在线涩涩免费观看国产精品

基于微博文本的用戶人格分析模型研究

來源:期刊VIP網(wǎng)所屬分類:綜合論文時間:瀏覽:

  摘 要:傳統(tǒng)的微博用戶人格分析將人格分為五類,但未考慮人格類別之間潛在的關(guān)聯(lián)性。為此基于多標(biāo)簽集成分類方法(RAkEL)進行改進,構(gòu)建RAkEL-PA模型。RAkEL-PA模型使用標(biāo)簽集合中不同的隨機子集訓(xùn)練相應(yīng)的Label Powerset(LP)分類器,然后集成所有分類結(jié)果作為最終分類結(jié)果。在微博用戶文本消息數(shù)據(jù)上進行實驗,結(jié)果表明,RAkEL-PA模型的兩個不同策略對用戶人格分類準(zhǔn)確率較高。RAkEL-PA模型充分考慮多個人格之間的相關(guān)性,以提高用戶人格分類魯棒性。

  關(guān)鍵詞:大五人格;人格分析;多標(biāo)簽學(xué)習(xí);RAkEL-PA;微博文本

社交論文發(fā)表

  0 引言

  心理學(xué)把個體人格研究與社交網(wǎng)絡(luò)結(jié)合,用社交網(wǎng)絡(luò)中用戶行為數(shù)據(jù)對用戶人格進行分析與預(yù)測[1],如工作績效預(yù)測[2]、青少年網(wǎng)絡(luò)成癮誘因分析[3]、抑郁癥預(yù)測[4]、人格與情緒表達關(guān)系[5]等,價值巨大。

  文獻[6]統(tǒng)計地理位置、發(fā)布頻率等移動互聯(lián)網(wǎng)用戶特征,將人格分類看作三分類和五分類問題實驗;文獻[6,7,8]分別采用新浪微博、Facebook、Twitter和YouTube數(shù)據(jù)集進行人格識別;文獻[9,10]采用二進制粒子群算法和半監(jiān)督算法建立社交網(wǎng)絡(luò)用戶人格分析模型;文獻[11]將人格分類問題轉(zhuǎn)化為二分類問題;Rosen等[12]針對用戶個體網(wǎng)站內(nèi)容分析用戶人格;Ross等 [13]通過研究用戶數(shù)據(jù)得出外向型與組成成員個數(shù)關(guān)系密切。

  以上方法都是將五維人格看作不相干任務(wù)執(zhí)行,而事實上五個維度之間有一定關(guān)聯(lián)[1,6-8,11,14]。本文通過對多標(biāo)簽集成方法—隨機k標(biāo)簽集(Random k-LabELsets,RAkEL)[10]進行改進,構(gòu)建基于微博文本的RAkEL-PA(RAkEL-Personality Analysis)模型,綜合考慮五維人格相關(guān)性,彌補前人工作的空白。

  1 研究流程

  人格模型泛指大五人格模型(Big-Five Model),包括外向性(Extraversion,E)、神經(jīng)質(zhì)(Neuroticism,N)、宜人性(Agreeableness,A)、責(zé)任型(Conscientiousness,C)和開放性(Openness,O)五個維度[1]。

  本文研究流程:①獲取數(shù)據(jù):在微博上發(fā)放大五人格量表問卷,志愿者填寫問卷以及微博userID,采用userID通過爬蟲獲取志愿者微博文本數(shù)據(jù);②特征提?。簭奈⒉┪谋局刑崛∨c人格相關(guān)度高的特征,創(chuàng)建人格分析模型的特征屬性;③建立模型:構(gòu)建RAkEL-PA模型;④評估模型:采用分類準(zhǔn)確率Accuracy和損失函數(shù)Hammingloss兩個指標(biāo)進行評估。

  2 RAkEL-PA模型構(gòu)建

  2.1 數(shù)據(jù)獲取

  2.1.1 獲取用戶五維人格得分

  在問卷星網(wǎng)站上制作大五人格量表[1]作為調(diào)查問卷。制作5個分量表,每個分量表包括5個選項(非常不符合、不太符合、不確定、比較符合、非常符合)12個題目,分別記2、4、6、8和10分,其中有題目反向計分,滿分為100分。將問卷發(fā)放到微博,志愿者填寫問卷,根據(jù)得分標(biāo)注用戶五維人格標(biāo)簽。

  2.1.2 微博用戶數(shù)據(jù)獲取及數(shù)據(jù)預(yù)處理

  利用userID使用Python語言編寫微博爬蟲程序,爬取用戶3個月微博文本數(shù)據(jù)。刪除僅含圖片、表情等無用數(shù)據(jù)。

  2.2 特征提取

  本文使用CCPL開發(fā)的中文心理分析系統(tǒng)TextMind[14],產(chǎn)生已驗證的76個微博文本特征[14],如表1所示。另外,表情符號更能反應(yīng)用戶情緒,所以本文統(tǒng)計微博消息中含有的表情符號,并統(tǒng)計每條消息的影響力,如表2所示。

  由于特征量化為數(shù)值后差異巨大,必須對其先歸一化[11]。將每個特征進行[0,1]區(qū)間歸一化,如公式(1)所示。

  其中,[f]和[f*]分別為文本特征的原始值和歸一化值,[fmin]和[fmax]分別為所有用戶相應(yīng)特征的最小值和最大值。

  2.3 RAkEL-PA模型構(gòu)建

  2.3.1 多標(biāo)簽分類方法

  多標(biāo)簽學(xué)習(xí)方法主要有算法自適應(yīng)和問題轉(zhuǎn)換方法兩種[15]。前者主要包括支持向量機[7]和多標(biāo)簽[k]近鄰算法(ML-kNN)[16];后者主要有Binary Relevance(BR)[5]和Label Powerset(LP)。

  2.3.2 基于微博文本的RAkEL-PA模型構(gòu)建

  LP方法優(yōu)點是考慮標(biāo)簽相關(guān)性,但也存在不足[17],因此將大量標(biāo)簽的集合隨機分成很多小的標(biāo)簽集,采用LP為每個小標(biāo)簽集訓(xùn)練多標(biāo)簽分類器,將所有LP分類器決策集成得到RAkEL的最后結(jié)果。本文基于微博文本的用戶人格分析模型,構(gòu)建基于人格分析的不相交子集策略RAkELd-PA和基于人格分析的重疊子集策略RAkELo-PA。

  確定RAkELd-PA標(biāo)簽集[k]的大小,將標(biāo)簽集合[L]隨機分成[m=Mk]個不相交的[k]標(biāo)簽集[Rj],[j=1,2…m]。用LP學(xué)習(xí)[m]個多標(biāo)簽分類器[hj],[j=1,2…m]。每個分類器[hj]學(xué)習(xí)一個單標(biāo)簽分類任務(wù),包含訓(xùn)練集中所有[Rj]的子集類值。該策略中不同標(biāo)簽集中的標(biāo)簽不相交,所以標(biāo)簽數(shù)越多性能越好[18]。

  RAkELd-PA模型訓(xùn)練過程和分類過程分別如圖1和圖2所示。

  RAkELo-PA中[Lk]表示[L]中所有不同[k]標(biāo)簽集的集合。[Lk]大小由二項式系數(shù)[Lk=Mk]決定。與RAkELd-PA不同的是,已知標(biāo)簽集[k]的大小以及期望的分類器數(shù)量[m≤Lk],RAkELo-PA通過從[Lk]隨機采樣選擇[m]個[k]標(biāo)簽集[Ri],[i=1,2…m]。當(dāng)[mk>M]時標(biāo)簽集會重疊。

  在RAkELo-PA模型上訓(xùn)練過程和分類過程分別如圖3和圖4所示。

  3 實驗

  3.1 實驗數(shù)據(jù)集和特征提取

  本文共收到258份問卷,經(jīng)過篩選(如:每個問題答案相同)得到有效問卷169份。使用爬蟲得到用戶在微博上的文本消息。利用文心軟件提取文本特征,如表1和表2所示,并進行歸一化處理。標(biāo)簽數(shù)[M]為人格的五個維度。因此標(biāo)簽集界限是[25]=32,而實際標(biāo)簽集數(shù)量范圍為此邊界的5%~44%[17]。本文標(biāo)注的標(biāo)簽集中有8種標(biāo)簽集出現(xiàn)次數(shù)最多,將集中60%的數(shù)據(jù)作為訓(xùn)練集,其余作為測試集。

  3.2 模型評價指標(biāo)

  本文使用分類準(zhǔn)確度Accuracy(A)和Hammingloss(H)評估多標(biāo)簽分類效果。

  用[D]表示一個多標(biāo)簽數(shù)據(jù)集,[D]表示樣本個數(shù),[xi]表示第[i]個樣本,[yi?L]表示[xi]的標(biāo)簽集,[i=1,2…D]。本文通過學(xué)習(xí)一個多標(biāo)簽分類器[h]預(yù)測實例[xi]的標(biāo)簽集[zi],即[zi=h(xi)]。

  分類準(zhǔn)確度(A)[18]定義如下:

  3.3 實驗結(jié)果與分析

  3.3.1 RAkELd-PA模型實驗結(jié)果分析

  在RAkELd-PA實驗中,標(biāo)簽集[k]取2、3和4。[k]值不同模型數(shù)[m]也不同。

  如圖5所示:k=2時,模型的A值最高;k=3和k=4時,A值略低于k=2時,而LP的A值保持不變。原因是同時具有兩種人格特質(zhì)的人較多。隨著[k]值增大,[m]變小,參與訓(xùn)練的分類器個數(shù)變少,導(dǎo)致RAkELd-PA性能變差。

  如圖6所示:k=2時,模型H值最小;k=3和k=4時,H值略高,可見隨著[k]值增大,H值也在變大,而LP的H值不變。該模型的H最大值和LP的H值接近,說明隨著[k]值接近M,模型性能與LP性能相當(dāng)。

  3.3.2 RAkELo-PA模型實驗結(jié)果分析

  RAkELo-PA模型使用[k](2~4)的所有有意義值進行實驗。在k=2和k=3時,[m]范圍為1~10,k=4時,[m]范圍為1~5。RAkELo-PA模型的分類決策計算方式采用多數(shù)投票規(guī)則。

  如圖7所示:①k=2(同時具有兩種人格特質(zhì))時,A值在m=8時最高,與文獻[9]得出的結(jié)論一致,即A和C、C和E、C和O、O和E分別具有很強的相關(guān)性;②k=3時,A值在m=8時最高,文獻[11]也表明,C、A、E,E、C、O,O、A、C分別有強相關(guān)性;③k=4時,A值在m=4時最高,與k=2和k=3相比,同時具有4種人格特質(zhì)的人相對較少,所以A值略低于k=2和k=3時的A值,而LP的A值不隨[m]和[k]的改變而改變。

  如圖8所示:隨著[m]值增大,模型的H值在減小。k=2,m=7、8、9時,H值最小;k=3,m=8時,H值最小;k=4,m=3時,H值最小。LP分類器的H值不隨[m]和[k]的改變而改變??梢钥闯觯P偷腍值均比LP小,說明該模型性能比LP好。

  4 結(jié)語

  針對傳統(tǒng)人格分析方法未考慮五個人格維度之間的潛在相關(guān)性導(dǎo)致個體人格分類準(zhǔn)確率較低問題,提出RAkEL的改進模型RAkEL-PA實現(xiàn)個體人格分類。實驗結(jié)果表明,具有雙重人格特質(zhì)和三重人格特質(zhì)的人較多,說明五維人格之間存在依賴性。該模型考慮了五維人格之間的相關(guān)性,提高了微博用戶人格分類的準(zhǔn)確率,從而驗證了RAkEL-PA模型對人格分類的有效性。后續(xù)考慮獲取更多微博用戶數(shù)據(jù),在更大數(shù)據(jù)集上進行實驗,以進一步驗證該模型的有效性。

  參考文獻:

  [1] 張磊,陳貞翔,楊波. 社交網(wǎng)絡(luò)用戶的人格分析與預(yù)測[J]. 計算機學(xué)報,2014,37(8):1877-1894.

  [2] JUDGE T A, ZAPATA C P. The person–situation debate revisited: effect of situation strength and trait activation on the validity of the big five personality traits in predicting job performance[J]. Academy of Management Journal, 2015, 58(4): 1149-1179.

  [3] ZHOU Y, LI D, LI X, et al. Big five personality and adolescent internet addiction: the mediating role of coping style[J]. Addictive behaviors, 2017, 64(8): 42-48.

  [4] ALLEN T A, CAREY B E, MCBRIDE C, et al. Big five aspects of personality interact to predict depression[J]. Journal of personality, 2018, 86(4): 714-725.

  [5] 劉真亦. 不同人格傾向微博用戶的情緒表達分析[D]. 杭州:浙江大學(xué),2019.

  [6] 孫啟翔. 基于移動互聯(lián)網(wǎng)社交行為的用戶性格分析和預(yù)測[D]. 北京:北京理工大學(xué),2016.

  [7] FARNADI G,SITARAMAN G,SUSHMITA S,et al. Computational personality recognition in social media[J]. User Modeling and User-Adapted Interaction, 2016, 26(2-3): 109-142.

  [8] 楊潔. 基于用戶情感和網(wǎng)絡(luò)關(guān)系分析的人格預(yù)測模型[D]. 上海:東華大學(xué),2016.

  [9] 毛雨. 基于社交網(wǎng)絡(luò)的用戶人格分析研究與實現(xiàn)[D]. 北京:北京郵電大學(xué),2019.

  [10] 鄭赫慈. 網(wǎng)絡(luò)空間中人格分析的研究與實現(xiàn)[D]. 北京:北京郵電大學(xué),2019.

  [11] XUE D, HONG Z, GUO S, et al. Personality recognition on social media with label distribution learning[J]. IEEE Access, 2017, 5(142): 13478-13488.

  作者:舒曉敏

  推薦閱讀:全球社交網(wǎng)絡(luò)的新聞生態(tài)與國際輿論引導(dǎo)

亚洲成AV人片在线观看无| 亚洲区色情区激情区小说色情书| 亚洲AⅤ无码专区在线观看Q| 亚洲AV无码乱码忘忧草亚洲人| 亚洲精品中文字幕乱码三区| 一本色道久久综合一| 999国内精品永久免费视频| 把女人弄爽特黄A大片| 国产99视频精品免视看7| 国产一级 片内射30岁老熟女 | 婬乱丰满熟妇XXXXX性69| 18禁美女裸身无遮挡免费网站| WWWXXX国产| 国产精品久久无码一区| 久久精品国产亚洲77777| 男男GAy作爱免费观看| 日本三级黄色视频| 小诗的公交车日记第9章| 艳妇乳肉豪妇荡乳AV无码福利| AAA少妇高潮大片免费看| 国产AV无码专区亚洲AV毛片搜| 黑人入室粗暴人妻中出| 蜜臀AV无码人妻精品| 日日摸夜夜添夜夜添无码免费视频 | 亚洲成人AV网址| 中文字幕一线产区和二线区的区别| 被多个强壮的黑人灌满精| 国产午夜福利短视频在线观看| 狼人大香伊蕉国产WWW亚洲| 日韩欧美亚洲综合久久影院D3| 亚洲AV无码专区国产乱码APP| 中文字幕无码一线二线三线| 贵为皇后却被用来犒赏三军| 狠狠做深爱婷婷综合一区| 女儿的朋友5中汉字晋通话| 玩弄少妇人妻中文字幕| 亚洲已满18点击进入在线看片| 凹凸人妻人人澡人人添| 国产强伦姧在线观看无码| 蜜桃AV少妇久久久久久高潮不断| 熟女俱乐部五十路二区AV| 亚洲自偷图片自拍图片| 岛国无码AⅤ片在线观看| 九九视频麻婆豆腐在线观看 | 亚洲AV毛片一区二区三区| 99999久久久久久亚洲| 国产女人被狂躁到高潮小说 | 久久99精品久久水蜜桃| 日本乱码伦午夜福利在线| 亚洲精品高清国产一久久 | 日本丰满熟妇乱子伦| 亚洲精品第一国产综合麻豆| 成本人无码H无码动漫在线网站 | 情人伊人久久综合亚洲| 亚洲国产一区二区A毛片| 宝贝乖女你的奶真大水真多| 精品免费久久久久久久| 色婷婷六月亚洲综合香蕉| 一本色道无码不卡在线观看| 国产成人无码AV在线播放DVD| 麻花传媒MD0076沈芯语在线| 无码精品国产VA在线观看| AV免费网站在线观看| 精产国品一二三产品区别在哪 | 欧美专区日韩视频人妻| 亚洲女和黑人最新AV| 高清国语自产拍免费视频| 蜜臀av一区二区三区人妻| 亚洲AV无码国产精品色午友情链 | 精品久久久久久久中文字幕| 日韩欧美亚洲综合久久影院DS| 一二三四免费观看在线电影二| 国产精品国产三级国产AV浪潮 | 乖别添了快放进来我想要| 母亲とが话しています播放| 亚洲第一狼人伊人AV| 高潮和狂野射精合集| 嫩草在线视频WWW免费看| 亚洲国产精品成人精品无码区| 城中村快餐嫖老妇对白| 蜜桃中文字日产乱幕4区| 亚洲国产精品无码第一区二区三区 | 久久久久久久精品国产亚洲87| 无码人妻精品一区二区三区免费| もんむす くえすと资源网| 开心久久婷婷综合中文字幕| 亚洲AV无码片一区二区三区| 国产 精品 自在自线| 欧美一区二区三区孕妇精品| 亚洲综合激情另类小说区| 国产偷伦视频片免费视频| 上司侵犯部下的人妻| JLZZ大全高潮多水| 麻豆成人精品国产免费| 亚洲日韩精品无码AV海量| 国产在线精品无码二区| 四川丰满少妇A级毛片| 苍井空无码免费换线| 欧美黑人又大又粗又长久久久| 一边做饭一边躁狂怎么办| 黑人巨鞭大战丰满少妇| 午夜伦4480YY私人影院免费| 隔着衣服吃你的小尖尖作文| 人妻一本久道久久综合久久鬼色| 2021无码专区人妻系列日韩| 久久婷婷五月综合色和啪| 亚洲欧美一区二区三区| 狠狠躁夜夜躁人妻蜜臂AV| 香蕉久久AV一区二区三区APP| 国产SUV精二区九色| 色狠狠AV老熟女| 成人区精品人妻人妻AV| 人妻天天爽夜夜爽精品视频| Chinese丰满熟妇高潮| 牛牛影视亚洲AV成人片| 23部禽女乱小说内| 内射人妻无码色AV天堂| 最新无码人妻在线不卡| 免费精品无码AV片在线观看| 中文字幕日韩一区二区不卡| 鲁鲁鲁爽爽爽在线视频观看| 在线亚洲97SE亚洲综合在线| 浪潮AV色综合久久天堂| 泳池里强摁做开腿呻吟漫画视频| 久久精品亚洲精品国产色婷 | 亚洲成AV不卡无码无码不卡| 国精产品一二三产区| 亚洲AV无码成人影片在线观看| 国产亚洲精选美女久久久久| 亚洲AV无码一区二区一二区| 好大好深好猛好爽视频| 亚洲精品成AV人片天堂无码| 久久99精品国产麻豆| 夜夜爽夜夜叫夜夜高潮漏水| 老师穿着旗袍肉色丝袜让我玩| 再深点灬舒服灬太大了网站| 免费看视频高清在线观看| 99精产国品一二三产区区| 欧洲另类一二三四区| 成人区人妻精品一区二区不卡视频 | 久久亚洲精品成人无码网站| 中文字幕乱人伦高清视频| 欧美成人一区二区三区在线视频 | ぱらだいす天堂中文网WWW| 人妻精品久久无码区| 成人爽A毛片免费网站| 少妇性活BBBBBBBBB四川| 国产激情久久久久影院老熟女| 无码中文字幕加勒比高清| 激情都市 校园 人妻 武侠| 亚洲熟妇人av一区二区三区| 麻豆国产97在线 | 欧洲| JIZZJIZZ中国18大学生| 少妇被又大又粗又爽毛片| 国产裸拍裸体女网站链接在线观看| 亚洲AV无码专区在线播放| 久久久久久精品免费免费麻辣 | 亚洲区小说区图片区QVOD| 麻豆一区二区99久久久久| Z〇ZOZ〇女人另类ZOZ〇| 四季AV一区二区三区免费观看| 国产一区精选播放022| 亚洲最大无码成人网站4438| 牛鞭擦进少妇的下身| 非洲黑人妇女XXXXXHD| 亚洲AV日韩AV永久无码久久| 久久久久九九精品影院| HD女人奶水授乳MILK| 深入浅出TXL金银花讲的什么| 国产无遮挡无码视频免费软件| 亚洲少妇XXXXX| 漂亮人妻被强玩波多野结衣| 国产精品岛国久久久久| 亚洲欧洲综合有码无码| 欧美日韩人妻一区二区| 国产成人综合亚洲AV第一页| 亚洲全部无码中文字幕| 欧美一区二区三区性视频野战| 国产精品成人A区在线观看| 亚洲日韩一页精品发布| 欧亚专线欧洲S码W MY| 国产美女自卫慰黄网站| 樱桃空空人妻无码内射| 日韩精品人妻系列无码专区免费| 国产女人精品视频国产灰线| 用力挺进她的花苞| 色偷偷色噜噜狠狠网站30根 | 一二三四五在线播放免费观看中文 | 皇帝在御花园进入贵妃的小说| 2021自拍偷在线精品自拍偷| 天堂影院一区二区三区四区| 久久久久久精品免费免费| 抽插丰满内射高潮视频| 亚洲国产成人精品无码区在线观看| 蜜桃色欲AV久久无码精品软件| 国产VA免费精品高清在线| 一边做饭一边暴躁怎么办| 天堂在/线中文在线资源8| 美丽的熟妇中文字幕| 国产精品毛片一区内射|