Una Infraestructura de Investigación One-Click Reproducible que integra los rigurosos estándares metodológicos de DIME (Banco Mundial) y el AEA Data Editor, potenciada por un ecosistema de Protocolos de Inteligencia Artificial. Es la evolución oficial del paquete original de Stata
projectinit.
Autor: Maykol Medrano | GitHub: @MaykolMedrano
Inspirado por el trabajo en educación y reproducibilidad de Pedro Sant'Anna y Scott Cunningham (Causal Inference: The Mixtape).
projectinit-ai integra un entorno de investigación con una arquitectura modular basada en protocolos. El sistema automatiza la configuración de estructuras DIME y la aplicación de estándares técnicos en inferencia causal y visualización de datos.
Cuando generas un proyecto desde esta plantilla, obtienes un ecosistema congelado y ruteado:
YourProject/
├── 01_data/ # Datos Crudos, Limpios y Diccionarios (Codebooks)
├── 02_scripts/ # Data Preparation, Analysis, Validation y Master Scripts
│ ├── 00_master.do # DIME Master Do-file (Stata)
│ ├── 00_master.py # DIME Master Script (Python)
│ └── utilities/ # Gemini Lit Extractor y utilitarios
├── 03_outputs/ # Tablas LaTeX, Figuras y Logs originales
├── 04_literature/ # Papers descargados y Notas autogeneradas con IA
├── 05_doc/ # Manuscrito y presentaciones
├── 06_admin/ # Ética (IRB), Registro AEA (PAP) y Acuerdos de Mantenimiento
├── .agents/ # "El Cerebro": Checklists Causal/Code y Workflows de IA
├── CLAUDE.md # Sistema Operativo y "Custom Instructions" base
└── requirements.txt # "Freezing" del Ambiente y dependencias en Python
El siguiente diagrama ilustra cómo interactúan las Unidades de Protocolo con la estructura de archivos DIME y el flujo de trabajo:
graph TD
User([Usuario]) -->|Comandos /| Orch[Orquestador Principal]
Orch <-->|Technical Authority| Econ[Protocol: Econometrics]
Orch <-->|Ruteo de Datos| DIME[(Estructura DIME)]
Orch -->|Ejecución| Creator[Protocol: Creator]
Orch -->|Auditoría Científica| Critic[Protocol: Critic]
subgraph "Laboratorio Digital (DIME)"
DIME --- D1[01_data]
DIME --- D2[02_scripts]
DIME --- D3[03_outputs]
end
Creator -->|Genera Código| D2
Critic -->|Valida| D3
Critic -->|Cumplimiento| Econ
El verdadero poder de esta plantilla radica en su carpeta oculta .agents/. A través del archivo CLAUDE.md, cualquier IDE moderno (Cursor, VS Code) absorberá las "Protocol Units" de la Economía Cuantitativa.
Tu laboratorio incluye Unidades de Protocolo Autónomas:
- Protocol: Econometrics (Technical Authority): Posee el ADN de las Top 5 journals. Enforcea el "AER-Look" (no vertical lines, siunitx fix, clustered stars).
- Protocol: Creator (Execution Unit): Experto en Python/Stata enfocado en código limpio y reproducible.
- Protocol: Critic (Causal Identification): Auditor adversarial de diseños empíricos (SUTVA, Pre-trends, Low Power).
- Protocol: Verifier (Quality Gate): El último paso antes del cierre, califica la estética y el rigor técnico.
El framework incluye una galería de templates diseñados para cumplir con especificaciones técnicas de publicación:
Basados en criterios de proporcionalidad técnica (Líneas 1.1, Ejes 0.6):
- Event Studies & Parallel Trends
- Synthetic Control Method (SCM)
- Regression Discontinuity (RDD/RKD)
- Density Comparisons & IV Dashboards
Configuradas para alineación numérica mediante siunitx:
- Paper Pillar: Layout de alta densidad para múltiples outcomes.
- Saturated DDD: Especificaciones de triple diferencia.
- Heterogeneity Matrix: Análisis de canales y subgrupos.
- Advanced summary stats: Reporte de momentos estadísticos.
Todos los templates están disponibles en
gallery/para referenciar como "Gold Standard" durante la escritura del paper.
projectinit-ai provee los componentes finales para la sumisión y réplica:
- Master Manuscript (manuscript.tex): Un andamiaje LaTeX completo en
05_doc/que integra automáticamente el estiloprojectinit_aer.styy la configuraciónsiunitxprofesional. - Protocolo de Réplica (REPD.md): Guía de empaquetado final basada en los estándares del AEA Data Editor. Asegura que el proyecto sea reproducible por terceros desde el primer día.
- Estilo Centralizado (projectinit_aer.sty): Encapsula el ADN visual de la AER/NBER, permitiendo que tus tablas
.texsean limpias y modulares.
¿Cómo usarlos? Solo abre el chat de tu IA y escribe los Workflows globales:
- Protocolo: Contractor Mode (
/contractor-mode): Activa el ciclo adversario entre las unidades Critic y Creator hasta alcanzar la perfección técnica. - Análisis Pre-Flight (
/data-analysis): Obliga a la exploración rigurosa de datos antes de proponer modelos de estimación. - Scientific Humanizer (
/humanizer): Pule el tono académico de tus borradores y notas de lectura.
Este repositorio abandona los cuadernos desordenados (Jupyter/Do's aislados).
Se te genera un Pipeline de Ejecución Grado-Corporativo que:
- Fija semillas globales
np.random.seed()y de Python Built-in. - Determina rutas automáticas agnósticas a tu computadora usando
pathlib. - Captura toda la consola local y documenta una bitácora en
03_outputs/logs/master_{timestamp}.log. - Ejecuta los scripts con
subprocessdeteniendo la cola si algún modelo de Análisis o Preparación falla.
Incluye el clásico andamiaje NBER:
adopath ++para aislar tu ambiente de librerías en Stata.- Instalador silencioso de dependencias en
02_scripts/utilities/stata_packages.do. - Ejecución limpia y lineal asegurando
set seed.
El repositorio incluye una herramienta en 02_scripts/utilities/gemini_lit_extractor.py para procesar documentos PDF y generar resúmenes técnicos en 04_literature/reading_notes.
-
Obtén tu llave y ejecútalo en consola:
set GOOGLE_API_KEY=tu_clave_aca -
Deposita PDFs en
04_literature/papers/. -
Ejecuta:
python 02_scripts/utilities/gemini_lit_extractor.py --api-key TU_CLAVE_AQUI
(Opcional: Si ya tienes exportada la variable
GOOGLE_API_KEY, simplemente ejecutapython 02_scripts/utilities/gemini_lit_extractor.py) -
Revisiones de literatura (Pregunta Central, Datos, Métodos, Fallas Causales) aparecerán auto-escritas en formato Markdown.
Paso 1: Instalación del paquete (Vía PIP)
Abre tu terminal y ejecuta:
pip install projectinit-aiPaso 2: Genera tu Laboratorio Inicial
Navega a la carpeta donde quieras crear tu investigación y ejecuta:
projectinit-ai nombre_de_tu_proyecto(Esto creará la carpeta con la estructura DIME y los Agentes instantáneamente).
Paso 3: Desarrolla tu Paper e Inicializa los Agentes
Entra a la carpeta (cd nombre_de_tu_proyecto), instala las dependencias locales (pip install -r requirements.txt) y abre tu Editor (Cursor / VS Code). El CLAUDE.md levantará a los Agentes de inmediato.
Usa tu chat para pedir modelos y deja que el /contractor-mode audite tu econometría y guarde tus tablas impecables en 03_outputs.
El framework está diseñado para ser "AI-Native", permitiendo que diferentes herramientas de asistencia técnica absorban el conocimiento del proyecto:
- Cursor / Windsurf: Estos IDEs leen automáticamente el archivo
CLAUDE.mden la raíz del proyecto. Al abrir la carpeta, el agente asumirá los principios de DIME y los protocolos de visualización definidos. - Claude Desktop / Cline / Roo Code: Se recomienda indexar la carpeta
.agents/para que el asistente tenga acceso a los checklists y workflows de validación econométrica. - Antigravity / Custom Agents: El archivo
CLAUDE.mdsirve como la "Constitución" del proyecto, definiendo las reglas de escritura de código y reporte de resultados.
- CLAUDE.md: Centraliza las reglas de estilo de código, la estructura de carpetas y los comandos disponibles.
- Directorio .agents/: Contiene los protocolos específicos (Econometría, Creador, Crítico) y checklists que el agente debe consultar antes de finalizar cualquier tarea.
Esta Infraestructura es la culminación de buenas prácticas recopiladas de:
- DIME (World Bank) — Arquitectura de Archivos Global.
- AEA Data Editor — Estándares de Transparencia del Código.
- J-PAL (MIT) — Integridad de Datos e Investigación Limpia.
Este repositorio está distribuido libremente bajo la licencia MIT.