Я специализируюсь на преобразовании сложных наборов данных в интуитивно понятные и визуально привлекательные представления, что упрощает их понимание и использование для принятия решений. Это включает создание интерактивных дашбордов, диаграмм, графиков, инфографики и подробных отчетов.
В данном списке представлены некоторые мои проекты, связанные с анализом данных (исключая вклад в open-source и прочие проприетарные или небольшие проекты).
Дашборды
Прототип дашборда на основе проекта в области стратегического маркетинга, созданного с помощью Apache Superset



Дашборды
Дашборд маркетинговой аналитики c ETL для сегментации аудитории и анализа ROI, реализованный с помощью Dash и Airflow

Компьютерное зрение, дашборды
Обработка медицинских изображений/видео: оптический поток (Farneback, Lucas-Kanade, глубокое обучение), поиск похожих изображений (SIFT/ORB/CNN-эмбеддинги), определение объектов и интерактивный дашборд (Dash)
Дашборды
Аналитическая платформа, использующая интеграции REST API, анализ тональности/трендов и интерактивные дашборды в реальном времени (Python, Flask, Dash), агрегирующие данные из Twittter, Facebook, Instagram, Discord, Medium, Reddit, YouTube и TikTok для целей маркетинга
Дашборды
Дашборд для аналитики исторических данных и данных в реальном времени, объединящий несколько источников (соцсети, сервер, HR, финансовые метрики, транзакции, маркетинговый отдел) с помощью интеграции, стриминга, визуализаций и машинного обучения (Apache Superset, Grafana, Kafka, Prometheus, Python, React)
Аналитика клиентов
End-to-end приложение для аналитики, объединяющее прогнозирование оттока/CLV, сегментацию клиентов и lead scoring в решение с пайплайнами данных и дашбордом
Компьютерное зрение
Комплексная система анализа дорожного движения на кольцевых развязках: обработка данных с нескольких камер в реальном времени, интеграция с Kafka для обмена сообщениями, InfluxDB для хранения временных рядов и Grafana для интерактивных дашбордов. Обрабатывает потоки RTSP или локальные .mp4-файлы, вычисляет количество и интенсивность движения (автомобилей в минуту), поддерживает параллелизм.
QA-системы, анализ больших данных
QA-приложение на основе LLM для работы с большими массивами предварительно загруженных документов, файлов данных, статей Википедии и спарсенных веб-страниц, реализующее графы знаний, аналитику, диаграммы и Streamlit-интерфейс
QASATIK — это приложение, помогающее исследовать большие объемы документов, файлов данных и веб-страниц. Созданное на основе Streamlit, оно поддерживает загрузку файлов, онлайн-скрапинг статей и запросы с использованием настраиваемых языковых моделей (OpenAI, LangChain, LlamaIndex). Кроме того, инструмент оснащен интерактивными визуализациями в виде графов знаний, различной аналитики и диаграмм, помогающими лучше разобраться в природе данных.