Data Mining / Community Detection

基于代表节点的重叠社区发现算法改进与实验分析

围绕原“代表节点 + 单阈值”重叠社区发现程序在社区表达、相似度选择和阈值稳定性上的问题，重构 Part 1/2/3 实验流水线，引入真实代表节点评分、虚拟几何中心对照、自适应相似度、阈值候选扫描、隶属度过滤、候选质量选择和 Oracle Gap 分析，用 LFR 加权网络对 NMI、Precision、Recall、F-score 与运行时间进行对齐评估。

从原方法入手定位问题：单个真实代表节点对社区整体表达有限，直接边权相似度对稀疏图敏感，单阈值判断缺少稳定性判断。

将程序拆成 Part 1 数据读取与相似度计算、Part 2 阈值扫描与候选生成、Part 3 候选质量评价与最终选择，后续改动可以落到明确环节。

在真实代表节点版本之外加入虚拟几何中心对照，并按图密度切换稀疏图余弦相似度与密图平均边权相似度。

补充 Python 批量评价、NMI 计算、单网络可视化和 Oracle Gap 分析工具，把算法修改、结果评价和问题定位连接成完整实验链路。

Snapshot

对齐结果

14共同 caseoriginal、part_v6、full_v6 和 virtual center 版本共同覆盖的公平对比样本数。

0.865669part_v6 平均 NMI共同 case 口径下，original 平均 NMI 为 0.348747，part_v6 提升 0.516921。

0.915664part_v6 平均 F-score共同 case 口径下，original 平均 F-score 为 0.089776。

972Oracle 候选记录Oracle Gap 表记录 28 个数据集下的阈值候选及 candidate_nmi。

Timeline

推进过程

2026.05梳理原代表节点重叠社区发现程序，确认原方法在代表节点表达、输入数据统一和评价口径上的问题。

2026.05改造 C++ 主程序输入输出，将网络读取、真实社区读取、相似度计算、阈值扫描和结果导出拆分为稳定接口。

2026.05形成 v6 版本：加入自适应相似度、候选扫描、隶属度过滤、密图最大断崖过滤和候选质量选择策略。

2026.06用 original / full_v6 / part_v6 / virtual center 等版本做共同 case 对齐分析，输出版本对比汇总。

需要密码

基于代表节点的重叠社区发现算法改进与实验分析

对齐结果

推进过程

方法与工具

技术路线

Oracle Gap 定位指标

相关文件

流程图与实验可视化

改进说明预览

相关文件