Abstract
we studied the problem of assessing the quality of implicit community detection in a graph constructed from data imported from social networks and instant messengers. Additionally, we analyzed methods for identifying indoctrination within such networks. We considered two approaches to evaluating the accuracy of community detection. The first approach, based on information theory, involved calculating normalized mutual information (NMI) and asymmetrically normalized mutual information (ANRMI). The second approach examined three methods for assessing the quality of implicit community detection using text analysis. We determined and compared pairwise rank correlation coefficients for dictionaries derived from different text arrays. We also applied correspondence analysis to study corpora of community texts. The third method involved calculating the psycholinguistic characteristics of text arrays associated with implicit communities. Using real data, we demonstrated the applicability of these methods for evaluating the partitioning of a social network graph and analyzing information influence within the network.
References
Fortunato S., Newman M. E. J. 20 Years of Network Community Detection. Nat. Phys. 2022;18:848–850.
Чеповский А. А. О неявных сообществах на графе взаимодействующих объектов. Успехи кибернетики. 2023;4:56-64. DOI: 10.51790/2712-9942-2023-4-1-08.
Чеповский А. А. Анализ графов взаимодействующих объектов. М.: Национальный открытый университет «ИНТУИТ»; 2022. 270 с.
Fortunato S. Community Detection in Graphs. Physics Reports. 2010;486:75-174.
Danon L., Díaz-Guilera A., Duch J., Arenas A. Comparing Community Structure Identification. J. Stat. Mech. 2005;P09008.
Lancichinetti A., Fortunato S., Radicchi F. Benchmark Graphs for Testing Community Detection Algorithms. Physical Review. 2008;E78:046110. 6 p.
Newman M. E. J., Cantwell G. T., Young J.-G. Improved Mutual Information Measure for Clustering, Classification, and Community Detection. Physical Review E. 2020;101:042304. DOI: 10.1103/PhysRevE.101.042304.
Jérôme A., Kirkley A. Asymmetrically Normalized Mutual Information: Unbiased Measure for Comparing Clusterings with Different Numbers of Clusters. Physical Review E. 2020;101:042301.
Jerdee M., Kirkley A., Newman M. E. J. Normalized Mutual Information is a Biased Measure for Classification and Community Detection. arXiv:2307.01282. DOI: 10.48550/arXiv.2307.01282.
Аванесян Н. Л., Зенькова В. В., Чеповский А. А., Чеповский А. М. Анализ текстов сообществ социальных сетей. Успехи кибернетики. 2023;4:33-39. DOI: 10.51790/2712-9942-2023-4-2-05.
Фокина А. И., Чеповский А. А., Чеповский А. М. Использование платформы TXM корпусного анализа для анализа текстов сообществ социальных сетей. Вестник НГУ. Серия: Информационные технологии. 2023;21:29–38. DOI: 10.25205/1818-7900-2023-21-2-29-38.
Чеповский А. А. Об особенностях построения и анализа графов взаимодействующих объектов в сети Telegram-каналов. Вопросы кибербезопасности. 2023;1:75-81. DOI: 10.21681/2311-3456-20231-75-81.
Мамаев И. Д., Митрофанова О. А. Лингвистические параметры для идентификации скрытых сетевых сообществ. Terra Linguistica. 2024;15:102–115. DOI: 10.18721/JHSS.15108.
Мамаев И. Д. Лингвистические профили скрытых сообществ: морфосинтаксический аспект. Филологические науки. Вопросы теории и практики. 2024;17:1155-1162. DOI: 10.30853/phil20240168.
Соловьев Ф. Н. Автоматическая обработка текстов на основе платформы TXM с учетом анализа структурных единиц текста. Вестник НГУ. Серия: Информационные технологии. 2020;18:74–82. DOI: 10.25205/1818-7900-2020-18-1-74-82.
Blondel V. D., Guillaume J.-L., Lambiotte R., Lefebvre E. Fast Unfolding of Communities in Large Networks. Journal of Statistical Mechanics: Theory and Experiment. 2008;10:P10008.
Бендат Дж., Пирсол А. Прикладной анализ случайных данных. М.: Мир; 1989. 540 с.
Деза Е. И., Деза М. М. Энциклопедический словарь расстояний. М.: Наука; 2008. 444 с.
Benzécri J.-P., Bellier L. L’analyse des données. V. 2: L’analyse des Correspondances. Paris: Dunod; 1976. 616 p.
Heiden S. The TXM Platform: Building Open-Source Textual Analysis Software Compatible with the TEI Encoding Scheme. Proceedings of the 24th Pacific Asia Conference on Language, Information and Computation. Sendai, Japan. 2010:389–398.