現在位置首頁 > 博碩士論文 > 詳目
論文中文名稱:辨識訊息之可信度-以Facebook為例 [以論文名稱查詢館藏系統]
論文英文名稱:Identifying the credibility of information - A case study of Facebook [以論文名稱查詢館藏系統]
院校名稱:臺北科技大學
學院名稱:管理學院
系所名稱:資訊與財金管理系碩士班
畢業學年度:105
畢業學期:第二學期
出版年度:106
中文姓名:洪珮容
英文姓名:Pei-Jung Hung
研究生學號:104AB8008
學位類別:碩士
語文別:中文
論文頁數:57
指導教授中文名:翁頌舜
指導教授英文名:Sung-Shun Weng
口試委員中文名:楊欣哲;吳瑞堯
中文關鍵詞:內容農場資訊增益決策樹支持向量機懶惰學習貝氏分類器
英文關鍵詞:Content FarmInformation GainDecision treeSupport Vector MachinesLazy Learning of Bayesian Rules
論文中文摘要:隨著虛擬社群的迅速發展,其已成為用戶得知資訊的主要管道之一,而近年來虛擬社群中出現內容農場在其建立社群專頁,並且發佈許多真假難辨的訊息,讓許多用戶因此無法自行辨識此訊息之真假。
本研究提出一個「辨識訊息之可信度」的模組,蒐集Facebook中的內容農場粉絲專頁為實驗資料,且運用過去文獻的特徵加上本研究提出的新特徵為特徵集合,採用資訊增益之方法篩選出重要的特徵,再將其分別放入三種分類器中進行建模,本實驗結果發現以支持向量機之分類效果最好,其F-measure達80%以上,且加入本研究提出的新特徵值也具有提高分類效果。
論文英文摘要:With the rapid development of virtual community, it has become one of the main pipelines that users receive information. In recent years, the content farm community has appeared in the virtual community, and released many true and false messages, therefore, making users unable to identify the messages.
This study proposes a model collecting data from the content farm of Facebook fan pages as the experimental data. According to the literatures, this study uses the features proposed by previous studies and the new features collected in this study. After then, we use the method of information gain to select important features, and put them into three kinds of classifiers for modeling. The results showed that the F-measure value of the classification model developed by the Support Vector Machine algorithm is more than 80%. As well, adding the new features proposed by this study also has significant effects.
論文目次:摘要 i
ABSTRACT ii
誌謝 iii
目錄 iv
表目錄 vi
圖目錄 vii
第一章 緒論 1
1.1 研究背景與動機 1
1.2 研究目的 4
1.3 研究流程 5
第二章 文獻探討 6
2.1 虛擬社群(Virtual Community) 6
2.1.1 虛擬社群之意涵 6
2.1.2 虛擬社群與媒體訊息 7
2.2 內容農場(Content Farm) 8
2.3 謠言(Rumor) 9
2.3.1 謠言之定義 9
2.3.2 謠言分析 9
2.4 分類特徵(Features for Classification) 10
2.5 特徵選取(Feature Selection) 11
2.5.1 特徵選取之意涵 11
2.5.2 資訊增益 12
2.6 分類演算法(Classification Algorithm) 13
2.6.1 決策樹 13
2.6.2 支持向量機 14
2.6.3 懶惰學習貝氏分類器 15
第三章 研究設計與方法 17
3.1 研究架構 17
3.2 資料蒐集 18
3.3 資料預處理 19
3.3.1 區分訊息是否具有新聞價值 20
3.3.2 區分具有新聞價值之真假訊息 20
3.4 辨識訊息之可信度模組 22
3.4.1 特徵集合 22
3.4.1.1 過去文獻提出特徵 23
3.4.1.2 新特徵 25
3.4.2 特徵選取 28
3.4.3 分類模型 29
3.4.3.1 分類模型之資料處理 30
3.4.3.2 分類模型之實驗 30
第四章 實驗分析與結果 32
4.1 實驗環境 32
4.2 實驗資料蒐集 32
4.3 實驗資料預處理 34
4.4 實驗評估方法 35
4.5 實驗結果與討論 36
4.5.1 建立特徵集合 36
4.5.2 選取具有正向影響之特徵值 47
4.5.3 分類模型結果 48
第五章 結論 52
5.1 研究結論與貢獻 52
5.2 研究限制與未來展望 54
參考文獻 55
論文參考文獻:1. 國立政治大學商學院民意與市場調查研究中心,2016年台灣寬頻網路使用調查報告,2016年12月截取自財團法人台灣網路資訊中心:http://www.twnic.net.tw/download/200307/20160922e.pdf,2016。
2. 創市際網路測量研究,2016年新聞資訊網站調查與使用概況,2016年12月截取自創市際雙周刊第五十九期:http://www.ixresearch.com/%3Fp%3D12706,2016。
3. 創市際網路測量研究,2016年台灣內容農場相關媒體使用概況,2016年1月截取自創市際雙周刊第五十六期:http://www.ixresearch.com/reports/創市際雙週刊第五十六期-20160115/,2016。
4. 張詠晴,假新聞網站靠臉書賺進大半流量,天下雜誌,2016。
5. 張詠晴,當讀者被假新聞愚弄臉書豈能賣傻?,天下雜誌,2016。
6. 黃哲斌,川普總統戳破媒體臭氧層,天下雜誌611期,2016。
7. 汪志堅、駱少康,以內容分析法探討網路謠言之研究,國立台北大學資訊管理系,2002。
8. 林照真,社群網站與新聞生產:從聚合觀點檢視全球性媒體如何經營社群網站,中華傳播學會,2014。
9. 江佳穎,從網路社群意識探討新聞媒體的社群經營-以蘋果日報臉書粉絲專頁為例,碩士論文,私立玄奘大學大眾傳播學系,2014。
10. 何兆軒,用於基因微陣列資料的兩階段式基因選擇,碩士論文,國立高雄應用科技大學電子與資訊工程系,2007。
11. 陳怡如, 臉書粉絲專頁經營之研究-以《ETtoday東森新聞雲》為例,碩士論文,私立世新大學公共關係暨廣告學系,2015。
12. 黃騰誼,以個人、社會及科技觀點探討社群媒體參與度對虛擬社群組織公民行為之影響-以Facebook為例,碩士論文,國立澎湖科技大學服務業經營管理系,2014。
13. Allport, G. W., & Postman, L. (1946). An analysis of rumor. Public Opinion Quarterly, 10(4), 501-517.
14. Allport, G. W., & Postman, L. (1947). The psychology of rumor.
15. AlRubaian, M., Al-Qurishi, M., Al-Rakhami, M., Rahman, S. M. M., & Alamri, A. (2015). A multistage credibility analysis model for microblogs. In 2015 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining (ASONAM) (pp. 1434-1440). IEEE.
16. Castillo, C., Mendoza, M., & Poblete, B. (2011). Information credibility on twitter. In Proceedings of the 20th international conference on World wide web (pp. 675-684). ACM.
17. Cortes, C., & Vapnik, V. (1995). Support-vector networks. Machine learning, 20(3), 273-297.
18. Forman, G. (2003). An extensive empirical study of feature selection metrics for text classification. Journal of machine learning research, 3(Mar), 1289-1305
19. Ju, A., Jeong, S. H., & Chyi, H. I. (2014). Will social media save newspapers? Examining the effectiveness of Facebook and Twitter as news platforms. Journalism Practice, 8(1), 1-17.
20. Kapferer, J. N. (1990). Rumors: Uses, interpretations, and images. Transaction Publishers.
21. Levinson, P. (2009). New new media. Boston: Allyn & Bacon.
22. Lin, P. (2009). A Framework for Consistency Based Feature Selection. Masters Theses, 62.
23. O’Keefe, T., & Koprinska, I. (2009, December). Feature selection and weighting methods in sentiment analysis. In Proceedings of the 14th Australasian document computing symposium, Sydney (pp. 67-74).
24. Qazvinian, V., Rosengren, E., Radev, D. R., & Mei, Q. (2011). Rumor has it: Identifying misinformation in microblogs. In Proceedings of the Conference on Empirical Methods in Natural Language Processing (pp. 1589-1599). Association for Computational Linguistics.
25. Quinlan, J. R. (1979). Discovery rules from large collections of examples: a case study. Expert Systems in the Microelectronic Age, 87-102.
26. Quinlan, J. R. (1986). Induction of decision trees. Machine learning, 1(1), 81-106.
27. Rheingold, H. (1993). The virtual community: Finding commection in a computerized world. Addison-Wesley Longman Publishing Co., Inc..
28. Rheingold, H. (2000). The virtual community: Homesteading on the electronic frontier. MIT press.
29. Shibutani, Tamotsu. Improvised news: A sociological study of rumor. Ardent Media, 1966.
30. Yang, F., Liu, Y., Yu, X., & Yang, M. (2012). Automatic detection of rumor on Sina Weibo. In Proceedings of the ACM SIGKDD Workshop on Mining Data Semantics (p. 13). ACM.
31. Zheng, Z., & Webb, G. I. (2000). Lazy learning of Bayesian rules. Machine Learning, 41(1), 53-84.
論文全文使用權限:不同意授權