Краудсорсинг — это наука
Более пяти лет мы занимаемся краудсорсингом, и сегодня предлагаем вам использовать
наш опыт и результаты научных исследований.
Ключевые шаги к качественным данным
Краудсорсинг — это популярный способ сбора и разметки датасетов для обучения и настройки алгоритмов машинного обучения. Он позволяет более быстро и с меньшими затратами собирать и аннотировать данные по сравнению с традиционным подходом к решению ML-задач.

Результат разметки зависит от качества настройки процесса, а не от мастерства отдельного исполнителя.
Чтобы получить точные и актуальные данные — следуйте нашим советам. 

Декомпозиция
Разбейте задачу на этапы так, чтобы каждый из них был понятен любому исполнителю.
Инструкция
Составьте полную и ясную инструкцию, тогда разметка будет точнее.
Интерфейс
Создайте понятный и удобный интерфейс, чтобы исполнитель не ошибался.

Контроль качества
Настройте систему контроля, чтобы получить надёжный результат.
Цена задания
Найдите оптимальную цену для каждого проекта. 
Работа с результатами
Оцените итоги разметки, чтобы лучше настроить следующий проект.
Полезные инструменты
Мы разработали специальные инструменты — динамическое перекрытие и динамическое ценообразование. Они помогают поддерживать высокое качество разметки, не выходя за рамки бюджета. Узнать больше
Новости и события
Воркшоп на NeurlPS 2020
Мы соберём лучших мировых экспертов, чтобы обсудить ключевые вопросы подготовки данных для машинного обучения: эффективность удалённой работы, справедливость оплаты и распределения заданий, а также работу экономических механизмов, которые регулируют рынок краудсорсинга.
Туториал на SIGMOD/PODS 2020
Мы рассказываем о практических аспектах применения краудсорсинга для поиска информации в интернете. Вы узнаете, как создать датасет с похожими друг на друга товарами.
Туториал на CVPR 2020
Мы представляем процесс обработки данных, используемый для обучения беспилотных автомобилей. Получите практический опыт запуска проекта по разметке в Яндекс.Толоке.
Научная статья на KDD 2020
Научная статья специалистов Яндекса «Прогнозирование почасовой заработной платы и времени завершения заданий на краудсорсинговой платформе» была представлена на конференции KDD 2020.
Полезные ресурсы

YouTube-канал
Записи вебинаров и видеоинструкции.
Блог Толоки
Статьи о возможностях
платформы.
Обучение
Подать заявку на корпоративное обучение.
Открытые датасеты

Яндекс.Толока накопила большие объёмы качественных данных для решения ML-задач. Мы сделали датасеты публичными, чтобы поддержать академические исследования и стимулировать создание новых технологий.

Новости Яндекс.Толоки
Получайте информацию об обновлениях платформы, партнёрах, обучающих материалах.
Файлы cookies
Для персонализации сервисов Яндекс использует файлы cookies. Продолжая использование сайта, вы соглашаетесь с этим. Подробности о файлах cookies и об обработке ваших данных в Политике конфиденциальности.
Tue Nov 24 2020 10:25:27 GMT+0300 (Moscow Standard Time)