Skip to content

Spark application for prediction home and work coordinates of the customer by payment transactions

Notifications You must be signed in to change notification settings

lookuut/raif-competition

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

26 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Соревнование от Райффайзен банка в boosters.pro

Задача: используя координату, адрес, дату, код платежа, страну, город, валюту и id терминала предсказать координаты места жительства и координаты работы клиента банка

Цели участия - изучить язык программирования Scala, Apache Spark и алгоритмы машинного обучения

Для решения задачи были применены алгоритмы от mllib GBTClassifier, RandomForestClassifier, DecisionTreeClassifier, KMeans, DBSCAN. Также xgboost binary classification. Помимо алгоритмов машинного обучения, были применены технологии spark Pipeline, CrossValidator

Использованные библиотеки и исходники:
esri geometry https://github.com/Esri/geometry-api-java
DBSCAN https://github.com/mraad/dbscan-spark
xgboost https://github.com/dmlc/xgboost
Spark mllib

Краткий итог: нативные либы от Spark показали себя не очень, максимальный скор был при комбинировании DBSCAN, RandomForest и моим самописным CustomerPointFeature - 0.31. XGBoost с CrossValidation показали себя лучше - 0.365266, 69 место финальном рейтинге

About

Spark application for prediction home and work coordinates of the customer by payment transactions

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages