Antes de tudo você deve ter instalado:

Sync CassandraDb to ElasticSearch é uma ferramenta conceito feita para demostrar que é possível sincronizar dados entre fontes orientada a documento e outra orientada a colunas.

Antes de tudo você deve ter instalado:

CassandraDB http://cassandra.apache.org/download/
ElasticSearch http://www.elasticsearch.org/overview/elkdownloads/
Python >= 2.7

Instale as Depêndencias do Python:

Dentro do Projeto existe o arquivo requirements contento os pacotes que você deve instalar no Python:

$ pip install -r requirements.txt

Padronização de Classes:

Por padrão as classes do ElasticSearch deve iniciar sempre neste formado.

Padrão ElasticSearch Class

NomeDaClassElasticSearch
Ex: PostElasticSearch

Todas as classes do Tipo ElasticSearch deve herdar da class Base:

from cqlengine import columns
from models.base_elasticsearch import Base

class TestElasticSearch(Base):
   atributo_a = columns.Text()
   atributo_b = columns.Integer()
   atributo_c = columns.Float()

Por padrão o nome da coleção no ElasticSearch vai ficar test sendo que você tem a opção de utilizar o paramentro __ table__ para alterar o nome de onde deve ser salvo os dados:

from cqlengine import columns
from models.base_elasticsearch import Base
   
class TestElasticSearch(Base):
   atributo_a = columns.Text()
   atributo_b = columns.Integer()
   atributo_c = columns.Float()
   
   __table__ = 'logs'

Se você observar bem estamos utilizando o pacote cqlengine para fazer o mapeamento dos fields do ElasticSearch sendo que este pacote é um ORM para o cassandra. Pude observar que poderia desfrutar desse recurso de mapeamento tanto para o cassandra e elasticseach. No ElasticSearch você não precisa definir os campos que devem existe tudo é criado dinamicamente.

Padrão Cassandra Class

No cassandra você deve criar o esquema de fields antes de salvar os dados:

CREATE KEYSPACE cassandra_db WITH REPLICATION = { 'class' : 'SimpleStrategy', 'replication_factor' : 1 };
    
USE cassandra_db;
    
CREATE TABLE posts (
    id uuid,
    title text,
    description text,
    created_at bigint,
    PRIMARY KEY (id)
);

from cqlengine import columns
from models.base_cassandra import Base
    
class Posts(Base):
     description = columns.Text()
     title = columns.Text()

Veja a Relação de mapeamentos de nomes entre o Cassandra Class e Cassandra Table Name:

http://cqlengine.readthedocs.org/en/latest/topics/models.html#cqlengine.models.Model.__table_name__

Por padrão é criado automático o field created_at no Cassandra e ElasticSearch

Como Salvar

Cassandra

from models.posts_cassandra import Posts
post = Posts()
post.title = "Seraphim "
post.description = "For Today"
post.save()

ElasticSearch

from models.posts_elasticsearch import PostsElasticSearch
post_elasticsearch = PostsElasticSearch()
post_elasticsearch.title = "Overture 1928"
post_elaticsearch.description = "Dream Theater"
post_elaticsearch.save()

Daemon

Na raiz do projeto existe o arquivo main.py onde você tem a opção de:

   $ python main.py start|stop|restart

Agradeço ao http://www.jejik.com/articles/2007/02/a_simple_unix_linux_daemon_in_python/ utilizei uma classe muito boa para rodar aplicativos em daemon.

Util

Leia o config.py

Para o Futuro

O Sync Cassandra ElasticSearch está em desevolvimento essa versão é ALFA temos que melhorar as Exceptions, Utilizar Threads, Sharding. É padrões mais sólidos de Design patterns replication. O importante neste primeiro momento e fixar o conceito de replicação de dados entre o Cassandra e ElasticSearch

Name		Name	Last commit message	Last commit date
Latest commit History 35 Commits
models		models
tests		tests
.gitignore		.gitignore
README.md		README.md
atividade.log		atividade.log
config.py		config.py
daemon.py		daemon.py
main.py		main.py
requirements.txt		requirements.txt
sync.py		sync.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Antes de tudo você deve ter instalado:

Instale as Depêndencias do Python:

Padronização de Classes:

Padrão ElasticSearch Class

Padrão Cassandra Class

Como Salvar

Cassandra

ElasticSearch

Daemon

Util

Para o Futuro

About

Uh oh!

Releases

Packages

Uh oh!

Languages

elinaldosoft/sync_cassandra_elasticsearch

Folders and files

Latest commit

History

Repository files navigation

Antes de tudo você deve ter instalado:

Instale as Depêndencias do Python:

Padronização de Classes:

Padrão ElasticSearch Class

Padrão Cassandra Class

Como Salvar

Cassandra

ElasticSearch

Daemon

Util

Para o Futuro

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages