Разметка данных
для NLP-задач

Собирайте качественные датасеты любого объёма.
Улучшайте алгоритмы моделей обработки естественного языка.
Контролируйте процесс, сроки и качество разметки данных 24/7.
Контроль качества
Используйте встроенные методы и инструменты контроля качества для получения более точной разметки данных.
Масштабируемые проекты
С помощью миллионов исполнителей по всему миру собирайте и размечайте любые объёмы данных с нужной вам скоростью в режиме 24/7.
Эффективность затрат
Экономьте время и деньги, устанавливая удобные для вас сроки и стоимость выполнения заданий.
Бесшовная интеграция
Благодаря открытому API создавайте полностью автоматизированные процессы разметки данных.

Типы разметки

В Яндекс.Толоке вы можете организовать сбор и точную разметку обучающих данных высокого качества для улучшения алгоритмов NLP-моделей. Платформа позволяет ставить задачи по распознаванию именованных сущностей (NER), технологии синтеза речи (TTS), оптическому распознаванию символов (OCR) и многие другие.

Релевантность поиска

Используйте Яндекс.Толоку, для оценки качества поиска и улучшения алгоритмов ранжирования.
Стоимость 1000 заданий — 18 $. Время выполнения — 4 часа.*

Классификация текста

Попросите исполнителей оценить тексты, классифицировать их по содержанию или другим характеристикам.
Стоимость 1000 заданий — 18 $. Время выполнения — 2 часа.*

Анализ тональности текста

Закажите разметку текстов по настроению и тональности. Используйте полученные данные для любых целей, например для анализа отзывов клиентов и фильтрации спама.
Стоимость 1000 заданий — 4,5 $. Время выполнения — 1 час.*

Классификация намерений

Попросите исполнителей классифицировать запросы пользователей. С помощью полученных данных тренируйте чат-бота, голосового помощника или любую диалоговую систему.
Стоимость 1000 заданий — 4,5 $. Время выполнения — 1 час.*

Генерация высказываний

Обогащайте обучающую разговорную базу ИИ реальными репликами и диалогами, собранными исполнителями по вашим инструкциям и сценариям.
Стоимость 100 заданий — 6 $. Время выполнения — 1 час.*

Распознавание именованных сущностей

Используйте Яндекс.Толоку для задач распознавания именованных сущностей (NER), предложив исполнителям идентифицировать в тексте части речи, имена собственные и подобные языковые объекты.
Стоимость 1000 заданий — 18 $. Время выполнения — 1 час.*

Запись речи

Соберите коллекцию записей разных голосов с разными интонациями и в разных условиях (шум, тишина, лес, дорога).  Улучшайте технологию синтеза речи TTS (Text-to-Speech) с помощью полученных аудиоданных.
Стоимость 1000 заданий — 7 $. Время выполнения — 4 часа.*

Транскрипция аудио

Закажите расшифровку аудиофайлов и транскрипцию устной речи. Используйте полученные данные для улучшения моделей распознавания речи.
Стоимость 1000 заданий — 18 $. Время выполнения — 3 часа.*

Классификация аудио

Привлекайте исполнителей для определения эмоций, классификации звучащей речи по темам, идентификации событий в звуковых фрагментах или разговорах.
Стоимость 1000 заданий — 7,5 $. Время выполнения — 2 часа.*

Распознавание текста (OCR)

Дайте исполнителям задание распознать текст на отсканированных документах. Эти данные помогут настроить технологию оптического распознавания символов (OCR).
Стоимость 1000 заданий — 15 $. Время выполнения — 3 часа.*

Используйте Яндекс.Толоку, для оценки качества поиска и улучшения алгоритмов ранжирования.
Стоимость 1000 заданий — 18 $. Время выполнения — 4 часа.*

*Это примерная стоимость заданий с учетом 20% комиссии Яндекс.Толоки. Не является публичной офертой. Стоимость и время выполнения определяются заказчиками и зависят от типа задания, входных данных и других условий.

Краудсорсинг — ресурсы без ограничений

Для сбора и разметки данных необходимы ресурсы — время, силы и знания многих людей. Яндекс.Толока даёт доступ к неограниченному количеству исполнителей по всему миру. А умные инструменты и методики контроля качества делают процесс прозрачным и легко масштабируемым.

Статистика в реальном времени

Настройки платформы позволяют получать актуальную информацию о прогрессе. Используйте детальную аналитику, чтобы оптимизировать скорость, качество и бюджет ваших проектов.

Статистика по проектам в Яндекс.Толоке в реальном времени

Отзывы о Яндекс.Толоке

Используйте Яндекс.Толоку

Получайте размеченные данные для задач обработки естественного языка.
Wed Oct 21 2020 18:03:59 GMT+0300 (Moscow Standard Time)