Skip to content

WeIfeng-Z/Cognitive-classification--BERT

Repository files navigation

认知分类器说明文档

模型概述

本仓库包含基于ICAP理论(Chi et al., 2018)构建的四分类认知参与分析模型,专为科学传播场景设计:

类别代码 类别名称 对应ICAP层级 定义特征
0 建构认知 Constructive 在评论区生成与视频内容不完全相同的内容,但与主题相似,如延伸、总结、评价,提出独到想法、见解以及推理判断。
1 活跃认知 Active 在评论区生成视频内容的重复提及,对视频内容本身讨论,未形成与主题内容不同的信息。 如回答问题、重复视频内容。
2 被动认知 Passive 简单接受复制视频信息,未对信息加工处理,包括发送表情包、感谢、交流、学习等,表明简单地夸赞、看视频。
3 偏离认知 N/A 生成与内容主题无关的评论,与内容无任何关联性。

注:交互建构(Interactive)作为特殊维度单独处理,不在本分类器范围内。(最后注明社交媒体交互认知处理规则)

理论基础

ICAP框架适配

根据Chi et al.(2018)的ICAP理论,我们对原始框架做出以下调整:

  1. 层级映射
    • 建构认知 → Constructive
    • 活跃认知 → Active
    • 被动认知 → Passive
  2. 特殊处理
    • 交互认知(Interactive)单独建立分析流程
    • 偏离认知作为质量控制维度新增

科学传播OR社交媒体分析场景适配

针对表1所示的编码规则,我们:

  1. 保留"延伸/总结/评价"作为建构认知核心特征
  2. 将"重复提及"降级为活跃认知
  3. 表情包等明确归为被动认知

性能验证

基准测试结果

指标 整体 建构认知 活跃认知 被动认知 偏离认知
Precision 0.949 0.975 0.859 0.952 0.903
Recall 0.949 0.971 0.810 0.967 0.893
F1 0.949 0.973 0.834 0.960 0.898

混淆矩阵分析

建构认知的误判主要来自:

  • 8.3%被误判为活跃认知(当缺乏明显延伸特征时)
  • 1.6%被误判为偏离认知(当使用非常规表达时)

使用建议

典型应用场景

  1. 社媒科学视频评论分析
  2. 社媒科普文章读者反馈分类
  3. 学术社交媒体监测

交互认知处理流程

if detect_secondary_comment(comment):  # 检测二级评论特征
    process_as_interactive()          # 进入独立分析流程
else:
    classify_by_main_model()          # 使用本分类器

使用说明(1)

注意:交互认知数据需通过独立流程处理,本模型不适用于该维度分析;当然根据Kim(2022)的分析,高认知能够被认为是争论、辩论,与建构认知特性相同,所以如果如法爬取二级评论作为交互认知分析,可以考虑使用建构认知充当高认知

使用说明(2)

此外文件 case.py是我们的单个文本分类示例,下载模型文件后可以自行调用进行单个文本识别.类别1、2、3、4分别代表建构、活跃、被动、偏离

引用要求: 使用时请同时引用: [1] 张玮锋 & 贺一.(2025).科学传播中公众认知和情感在行为参与的作用——科学家与公民科学家比较分析.科学学研究,43(04),763-774.doi:10.16192/j.cnki.1003-2053.20241202.001

联系方式weifengzhang993@163.com

About

BERT-Based Cognitive Engagement Classifier for Social Media Comments A lightweight BERT model fine-tuned to classify short comments in science communication into 4 ICAP-based engagement levels

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages