Webir 2024

Variables de Ambiente

cp .env.example .env

Modificar las variables de ambiente en el archivo .env segun corresponda.

Requerimientos

Ver el archivo requirments.txt.

Para instalar los requerimientos ejecutar:

pip install -r requirements.txt

Para actualizar el archivo de requirments.txt hacer:

pip freeze > requirements.txt

Store

Data

En este modulo se gestiona los datos de las materias (subjects) y sus clases (lessons) que son almacenados en una base de datos no relacional de Mongo DB.

Ejecutando MongoDB

Para ejecutar Mongo DB localmente, simplemente se debe:

Instalar Mongo DB (Manual).
(Opcional) Instalar la interfaz de usuario MongoDB Compass.
Setear la variable de ambiente MONGODB_URI con el link de conexión correspondiente. Por defecto es mongodb://localhost:27017/.

Para ejecutar Mongo DB en el servidor, se debe:

Ir a Atlas MongoDB.
Ingresar con su cuenta.
Ingresar al proyecto Webir (se envio una invitación al proyecto). En este proyecto ya se creo un cluster que corre en AWS que se llama WebirDatabase.
Conectar al cluster WebirDatabase usando Python Drivers, lo cual ya esta configurado. Simplemente se tiene que modificar la variable de ambiente MONGODB_URI con el connection string correspondiente.
Agregar la IP local actual para que permita la conexión satisfactoriamente. Ver Network Access para otros tipos de conexiones (Por ejemplo para conectarse desde el colab).

Modelos de Subjects y Lessons

Dentro del modulo data hay un submodulo models en los cuales se tiene dos modelos: SubjectModel y LessonModel.

Estos modelos cuentan con metodos para crear, actualizar, obtener por el id, obtener un item por el valor de algun atributo y obtener todos los items de la colección correspondiente.

Ejemplo:

from store.data.models.subjects import SubjectModel
from store.data.models.lessons import LessonModel

model = SubjectModel()

id = model.create("AGPI", "fklgdflgnlkdngkdfnglkdfngkdlfnxg")
print(f"ID {id}\n")

s = model.get(id)
print(f"Retrieved subject: {s}\n")

all = model.get_all()
print(f"All subjects: {all}\n")


lessons = LessonModel()
id1 = lessons.create(id, "Clase 1","url1", "videourl1")
id2 = lessons.create(id, "Clase 2","url2", "videourl2")

allS = lessons.get_all()
print(f"All lessons: {allS}\n")

s1 = lessons.get(id1)
print(f"Retrieved Lesson: {s1}\n")

lessons.update(id1, {"transcribed": True})

sTranscribed = lessons.get_by({"transcribed": False})
print(f"Retrieved Lesson Not Transcribed: {sTranscribed}\n")


swith_lessons = model.get(id, True)
print(f"Retrieved subject with lessons: {swith_lessons}\n")

Embedding

Transcriptor

Este modulo se encarga de transcribir las clases de las materias almacenadas en la base de datos de MongoDB. Actualmente se transcriben solo las clases de las materias definidas dentro del arreglo subjects en el archivo transcriptor/transcriptor.py. Para ejecutar el transcriptor, se debe correr el siguiente comando:

python main.py transcriptor

Verificar MONGODB_URI para saber de donde está obteniendo la info (localhost o en el servidor de atlas).

Scrapper

Para ejecurar el scrapper se debe correr el siguiente comando:

python main.py scrapping

Verificar MONGODB_URI para saber donde se esta guardando la info (localhost o en el servidor de atlas).

Loader

Se puede ejecutar el loader, desde la raiz del proyecto de las siguientes maneras:

Llamando al script loader usando main.py

python main.py loader (--seed [path to folder with seeding data] | --drop)

Ejecutando el script loader.py directamente como un modulo de python

python -m loader.loader (--seed [path to folder with seeding data] | --drop)

Note: se asume que el path_to_folder es relativo a donde se esta ejecutando el script.

Note: acordarse de agregar tu ip publica a la whitelist de ips en el cluster de mongo atlas (Ver Ejecutando MongoDB) al usar la funcionalidad seed dado que se conecta al mismo para recuperar los id de las clases transcritas.

Backend

Para ejecutar el backend, se debe correr el siguiente comando:

fastapi (run | dev) backend/api.py

Note: See FastAPI CLI docs

Set up

Run the docker compose file to instantiate the mongo db
Run the scrapper to load the mongo db
Transcribe some lessons
Merge the existing db with one with the new transcriptions

Improvements

Tools

mypy
ruff
pylint
pyupgrade

Setting up the db

mongosh "mongodb://${MONGO_ROOT_USER}:${MONGO_ROOT_PASSWORD}@localhost:27017"

Current Mongosh Log ID: xxx
Connecting to: mongodb://<credentials>@localhost:27017/?directConnection=true&serverSelectionTimeoutMS=2000&appName=mongosh+2.2.6
Using MongoDB: 7.0.11
Using Mongosh: 2.2.6

test> use admin
switched to db admin
admin> db.grantRolesToUser("admin", [{ role: "readWrite", db: "openfing" }])
{ ok: 1 }
admin>

admin> use openfing
switched to db openfing
openfing> show collections
lessons
subjects

Name		Name	Last commit message	Last commit date
Latest commit History 121 Commits
RAG		RAG
backend		backend
benchmarks		benchmarks
chat		chat
loader		loader
pools		pools
scrapper		scrapper
store		store
transcriptor		transcriptor
.env.example		.env.example
.gitignore		.gitignore
.pylintrc		.pylintrc
README.md		README.md
constants.py		constants.py
docker-compose.yml		docker-compose.yml
image.png		image.png
main.py		main.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Webir 2024

Variables de Ambiente

Requerimientos

Store

Data

Ejecutando MongoDB

Modelos de Subjects y Lessons

Embedding

Transcriptor

Scrapper

Loader

Backend

Set up

Improvements

Tools

Setting up the db

About

Uh oh!

Releases

Packages

Uh oh!

Contributors 5

Uh oh!

Languages

guidodinello/OpenFingChat

Folders and files

Latest commit

History

Repository files navigation

Webir 2024

Variables de Ambiente

Requerimientos

Store

Data

Ejecutando MongoDB

Modelos de Subjects y Lessons

Embedding

Transcriptor

Scrapper

Loader

Backend

Set up

Improvements

Tools

Setting up the db

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors 5

Uh oh!

Languages

Packages