button_icon
button_icon
button_icon
button_icon
button_icon
button_icon
button_icon
button_icon
button_icon
button_icon



Данные необходимы для обучения моделей машинного обучения, и более качественные данные, как правило, улучшают метрики, позволяя решать бизнес-задачи более эффективно. Я готов собрать и разметить любые данные из открытых источников, используя различные техники скрапинга, взаимодействуя, если необходимо, с API или базами данных. Среди них могут быть данные из социальных сетей, отзывы о продуктах, рыночные тенденции для понимания общественного спроса, и т.д.

В данном списке представлены некоторые мои проекты, связанные с анализом данных (исключая вклад в open-source и прочие проприетарные или небольшие проекты).


🎯SEO-CTR-optimizer2024   1 неделя    source_logosource_logosource_logo

Цифровой маркетинг, веб-скрпинг

Решение для маркетинговой аналитики: скрапинг сайтов для получения SEO-факторов и предсказания показателей кликабельности (CTR) рекламы


🎯 SEO-CTR-optimizer  source_logosource_logosource_logo  Решение для маркетинговой аналитики: скрапинг сайтов для получения SEO-факторов и предсказания показателей кликабельности (CTR) рекламы

👀LTRS-scraper20 марта, 2024   2 дня    source_logosource_logosource_logo

Рекомендательные системы

Простой пайплайн, который собирает, предобрабатывает и размечает сырые данные (взаимодействие user-item) для построения гибридной рекомендательной системы, использующей коллаборативную фильтрацию (SVD, ALS) и обучение ранжированию (XGBoost ranking)


👀 LTRS-scraper  source_logosource_logosource_logo  Простой пайплайн, который собирает, предобрабатывает и размечает сырые данные (взаимодействие user-item) для построения гибридной рекомендательной системы, использующей коллаборативную фильтрацию (SVD, ALS) и обучение ранжированию (XGBoost ranking)

⛏️training-scraper6 ноября, 2021       source_logosource_logosource_logo

Веб-скрапинг, предобработка данных

Python-скрипт для веб-скрапинга, интеграции данных и дальнейшего обучения моделей. Использует BeautifulSoup для парсинга HTML, TensorFlow/Keras для создания и обучения baseline-моделей, а также несколько других библиотек для обработки данных и автоматизации.


⛏️ training-scraper  source_logosource_logosource_logo  Python-скрипт для веб-скрапинга, интеграции данных и дальнейшего обучения моделей. Использует BeautifulSoup для парсинга HTML, TensorFlow/Keras для создания и обучения baseline-моделей, а также несколько других библиотек для обработки данных и автоматизации.

🫐Парсеры Wildberries       source_logosource_logosource_logo

Парсинг API

Python-скрипты для парсинга Wildberries.ru, извлекающие данные через API


🫐 Парсеры Wildberries  source_logosource_logosource_logo  Python-скрипты для парсинга Wildberries.ru, извлекающие данные через API

👁️Kallisto2025 – н.в.       source_logosource_logosource_logo

Разведка по открытым источникам, NLP, веб-агенты, веб-скрапинг

OSINT-инструмент, предназначенный для проведения глубокого поиска в Интернете путем объединения нескольких веб-агентов, использующих SOTA-методы машинного обучения. Программа краулит веб-страницы, собирая огромные объемы открытых данных, а затем использует языковые модели для выполнения NLP-задач по этим данным.


👁️ Kallisto  source_logosource_logosource_logo  OSINT-инструмент, предназначенный для проведения глубокого поиска в Интернете путем объединения нескольких веб-агентов, использующих SOTA-методы машинного обучения. Программа краулит веб-страницы, собирая огромные объемы открытых данных, а затем использует языковые модели для выполнения NLP-задач по этим данным.