Разметка данных 
для NLP-задач

Собирайте качественные датасеты любого объёма. Улучшайте алгоритмы моделей обработки естественного языка. Контролируйте процесс, сроки и качество разметки данных 24/7.
Начать
Контроль качества
Используйте встроенные методы и инструменты контроля качества для получения более точной разметки данных.
Масштабируемые проекты
С помощью миллионов исполнителей по всему миру собирайте и размечайте любые объёмы данных с нужной вам скоростью в режиме 24/7.
Эффективность затрат
Экономьте время и деньги, устанавливая удобные для вас сроки и стоимость выполнения заданий.
Бесшовная интеграция
Благодаря открытому API создавайте полностью автоматизированные процессы разметки данных.

Типы разметки

В Яндекс.Толоке вы можете организовать сбор и точную разметку обучающих данных высокого качества для улучшения алгоритмов NLP-моделей. Платформа позволяет ставить задачи по распознаванию именованных сущностей (NER), технологии синтеза речи (TTS), оптическому распознаванию символов (OCR) и многие другие.

Используйте Яндекс.Толоку, для оценки качества поиска и улучшения алгоритмов ранжирования.

Стоимость 1000 заданий — 18 $. Время выполнения — 4 часа.*

Попросите исполнителей оценить тексты, классифицировать их по содержанию или другим характеристикам.

Стоимость 1000 заданий — 18 $. Время выполнения — 2 часа.*

Закажите разметку текстов по настроению и тональности. Используйте полученные данные для любых целей, например для анализа отзывов клиентов и фильтрации спама.

Стоимость 1000 заданий — 4,5 $. Время выполнения — 1 час.*

Попросите исполнителей классифицировать запросы пользователей. С помощью полученных данных тренируйте чат-бота, голосового помощника или любую диалоговую систему.

Стоимость 1000 заданий — 4,5 $. Время выполнения — 1 час.*

Обогащайте обучающую разговорную базу ИИ реальными репликами и диалогами, собранными исполнителями по вашим инструкциям и сценариям.

Стоимость 100 заданий — 6 $. Время выполнения — 1 час.*

Используйте Яндекс.Толоку для задач распознавания именованных сущностей (NER), предложив исполнителям идентифицировать в тексте части речи, имена собственные и подобные языковые объекты.

Стоимость 1000 заданий — 18 $. Время выполнения — 1 час.*

Соберите коллекцию записей разных голосов с разными интонациями и в разных условиях (шум, тишина, лес, дорога). Улучшайте технологию синтеза речи TTS (Text-to-Speech) с помощью полученных аудиоданных.

Стоимость 1000 заданий — 7 $. Время выполнения — 4 часа.*

Закажите расшифровку аудиофайлов и транскрипцию устной речи. Используйте полученные данные для улучшения моделей распознавания речи.

Стоимость 1000 заданий — 18 $. Время выполнения — 3 часа.*

Привлекайте исполнителей для определения эмоций, классификации звучащей речи по темам, идентификации событий в звуковых фрагментах или разговорах.

Стоимость 1000 заданий — 7,5 $. Время выполнения — 2 часа.*

Дайте исполнителям задание распознать текст на отсканированных документах. Эти данные помогут настроить технологию оптического распознавания символов (OCR).

Стоимость 1000 заданий — 15 $. Время выполнения — 3 часа.*

* Не является публичной офертой. Стоимость и время выполнения определяются заказчиками и зависят от типа задания, входных данных и других условий.
Краудсорсинг — ресурсы без ограничений
Для сбора и разметки данных необходимы ресурсы — время, силы и знания многих людей. Яндекс.Толока даёт доступ к неограниченному количеству исполнителей по всему миру. А умные инструменты и методики контроля качества делают процесс прозрачным и легко масштабируемым.
Статистика в реальном времени
Настройки платформы позволяют получать актуальную информацию о прогрессе. Используйте детальную аналитику, чтобы оптимизировать скорость, качество и бюджет ваших проектов.
Статистика по проектам в Яндекс.Толоке в реальном времени

Отзывы о Яндекс.Толоке

Используйте Яндекс.Толоку
Получайте размеченные данные для задач обработки естественного языка.
Начать
Thu May 13 2021 19:01:06 GMT+0300 (Moscow Standard Time)