Open
Conversation
…ls/solvers/proofs) and remove legacy script
- 修改 fetch_commits.py 中的默认仓库路径为 ../../源代码 - 更新输出文件名从 commits.json 到 maxkb_commits.json - 升级 PyDriller 依赖版本从 2.1.1 到 2.9 - 将 PyGithub 版本约束改为 >=2.1.1 以支持更高版本
- 新增 setup_git_repo.py 脚本用于初始化或检查 MaxKB 源代码的 Git 仓库 - 添加 test_fix.py 脚本测试 PyDriller API 兼容性和参数配置 - 修改 fetch_commits.py 使用动态项目根目录路径作为默认仓库路径 - 实现 Git 仓库检查、初始化和用户交互功能 - 添加异常处理和操作状态反馈机制 - 提供详细的仓库设置向导和错误提示信息
- 新增 debug_paths.py 路径调试脚本用于排查路径问题 - 添加 test_final_path.py 测试脚本验证最终路径配置 - 创建 USAGE.md 文档详细说明 GitHub Commit 数据采集工具的使用方法 - 提供基本用法、参数配置、token 获取和输出文件说明 - 包含速率限制和大型仓库处理的最佳实践建议
- 替换 PyDriller 为 GitHub API 客户端进行数据提取 - 修改函数签名从 fetch_commits 为 fetch_github_commits - 添加 GitHub token 支持以避免 API 速率限制 - 实现 GitHub 仓库连接和 commit 获取功能 - 更新文件变更统计方式适配 GitHub API 返回格式 - 添加机器人账户过滤功能 - 修改数据摘要计算逻辑适应新的数据结构 - 更新命令行参数支持 GitHub 仓库名称输入 - 添加数据清洗和作者去重处理逻辑
- 从 fetch_commits.py 中删除了硬编码的 DEFAULT_GITHUB_TOKEN - 移除了命令行参数的默认令牌值 - 确保 GitHub 访问令牌仅通过命令行参数传入 - 提高了脚本的安全性,避免令牌泄露风险
- 实现了批量按月采集GitHub Commit数据的工具脚本 - 支持自定义时间范围从2023年6月至2024年2月 - 集成fetch_commits.py脚本进行分月数据获取 - 添加了数据采集进度显示和错误处理机制 - 生成按月份命名的JSON格式数据文件 - 包含快速数据分析和查看功能
- 新增 collect_monthly.py 脚本实现按月批量采集功能 - 新增 debug_collector.py 提供调试模式用于问题诊断 - 新增 monthly_collector.py 实现核心批量采集逻辑 - 新增 simple_test.py 简化版测试脚本验证基础功能 - 支持时间范围配置和进度显示 - 实现错误处理和超时控制机制 - 生成按月划分的JSON数据文件便于后续分析
- 移除 debug_collector.py 调试版本的按月采集脚本 - 移除 simple_test.py 简化版的单月数据采集测试脚本 - 清理临时测试和验证功能代码 - 移除相关调试和环境检查功能 - 删除测试相关的依赖和配置检查逻辑 - 整理项目中的临时测试工具文件
- 集成 GitHub API 获取最新提交日期 - 实现现有数据检测和增量采集逻辑 - 自动跳过已存在的数据文件 - 优化采集范围计算避免重复工作 - 添加环境变量配置支持 - 增强错误处理和用户提示信息
- 实现check_token_status函数检查GitHub token配置状态 - 在采集开始时显示是否使用token的信息 - 添加采集结果统计功能显示提取的commit数量 - 优化采集完成后的结果显示格式
- 引入 Auth 模块用于新版本 PyGithub 认证 - 实现新旧版本 PyGithub 的兼容性处理 - 使用 Auth.Token 方式进行 GitHub 认证 - 保留旧版本认证方式作为降级选项
- 实现merge_data.py脚本用于合并所有月份的commit数据 - 自动查找并加载data目录下的commits_*.json文件 - 将所有commit数据合并到all_commits.json输出文件 - 添加进度提示和统计信息显示功能 - 包含错误处理机制确保数据加载稳定性
|
Adding the "do-not-merge/release-note-label-needed" label because no release-note block was detected, please follow our release note process to remove it. DetailsInstructions for interacting with me using PR comments are available here. If you have questions or suggestions related to my behavior, please file an issue against the kubernetes-sigs/prow repository. |
|
[APPROVALNOTIFIER] This PR is NOT APPROVED This pull-request has been approved by: The full list of commands accepted by this bot can be found here. DetailsNeeds approval from an approver in each of these files:Approvers can indicate their approval by writing |
- 移除不必要的注释内容 - 保持代码简洁性
- 提取 stats 中的代码变更数据,添加插入和删除统计 - 处理时区问题:将 naive datetime 转换为 UTC 以避免时区冲突 - 生成贡献者分析结果文件,包含详细的贡献者统计数据 - 输出贡献者排名 CSV 文件,记录作者提交、插入、删除等详细信息 - 生成可视化数据 JSON 文件,用于帕累托分析和分布统计 - 计算核心团队规模和代码集中度指标
- 实现AdvancedVisualizer类提供3D贡献者景观图和网络图功能 - 创建时间序列热力图展示每周提交活动和活跃贡献者分布 - 开发3D帕累托分析图用于贡献者排名统计 - 构建代码变更分析图显示月度代码增删情况 - 设计贡献者多样性轮图展示贡献分布比例 - 生成多种格式的可视化结果文件到results目录
- 将贡献者多样性轮图改为饼图,并调整标签显示格式 - 修改图表输出格式从HTML改为PNG格式 - 更新方法名称从create_contributor_diversity_wheel为create_contributor_diversity_chart - 重命名create_interactive_contributor_network为create_3d_contributor_network - 移除多个临时调试和测试脚本文件 - 清理月度数据采集相关脚本 - 优化图表样式和布局设置
- 将贡献者多样性轮图改为饼图,并调整标签显示格式 - 修改图表输出格式从HTML改为PNG格式 - 更新方法名称从create_contributor_diversity_wheel为create_contributor_diversity_chart - 重命名create_interactive_contributor_network为create_3d_contributor_network - 移除多个临时调试和测试脚本文件 - 清理月度数据采集相关脚本 - 优化图表样式和布局设置
This file contains hidden or bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Add this suggestion to a batch that can be applied as a single commit.This suggestion is invalid because no changes were made to the code.Suggestions cannot be applied while the pull request is closed.Suggestions cannot be applied while viewing a subset of changes.Only one suggestion per line can be applied in a batch.Add this suggestion to a batch that can be applied as a single commit.Applying suggestions on deleted lines is not supported.You must change the existing code in this line in order to create a valid suggestion.Outdated suggestions cannot be applied.This suggestion has been applied or marked resolved.Suggestions cannot be applied from pending reviews.Suggestions cannot be applied on multi-line comments.Suggestions cannot be applied while the pull request is queued to merge.Suggestion cannot be applied right now. Please check back later.
What this PR does / why we need it?
Summary of your change
Please indicate you've done the following: