Разметка данных 
для NLP-задач

Собирайте качественные датасеты любого объёма. Улучшайте алгоритмы моделей обработки естественного языка. Контролируйте процесс, сроки и качество разметки данных 24/7.
Начать
Контроль качества
Используйте встроенные методы и инструменты контроля качества для получения более точной разметки данных.
Масштабируемые проекты
С помощью миллионов исполнителей по всему миру собирайте и размечайте любые объёмы данных с нужной вам скоростью в режиме 24/7.
Эффективность затрат
Экономьте время и деньги, устанавливая удобные для вас сроки и стоимость выполнения заданий.
Бесшовная интеграция
Благодаря открытому API создавайте полностью автоматизированные процессы разметки данных.

Типы разметки

В Яндекс.Толоке вы можете организовать сбор и точную разметку обучающих данных высокого качества для улучшения алгоритмов NLP-моделей. Платформа позволяет ставить задачи по распознаванию именованных сущностей (NER), технологии синтеза речи (TTS), оптическому распознаванию символов (OCR) и многие другие.

Используйте Яндекс.Толоку, для оценки качества поиска и улучшения алгоритмов ранжирования.

Стоимость 1000 заданий — 18 $. Время выполнения — 4 часа.*

Попросите исполнителей оценить тексты, классифицировать их по содержанию или другим характеристикам.

Стоимость 1000 заданий — 18 $. Время выполнения — 2 часа.*

Закажите разметку текстов по настроению и тональности. Используйте полученные данные для любых целей, например для анализа отзывов клиентов и фильтрации спама.

Стоимость 1000 заданий — 4,5 $. Время выполнения — 1 час.*

Попросите исполнителей классифицировать запросы пользователей. С помощью полученных данных тренируйте чат-бота, голосового помощника или любую диалоговую систему.

Стоимость 1000 заданий — 4,5 $. Время выполнения — 1 час.*

Обогащайте обучающую разговорную базу ИИ реальными репликами и диалогами, собранными исполнителями по вашим инструкциям и сценариям.

Стоимость 100 заданий — 6 $. Время выполнения — 1 час.*

Используйте Яндекс.Толоку для задач распознавания именованных сущностей (NER), предложив исполнителям идентифицировать в тексте части речи, имена собственные и подобные языковые объекты.

Стоимость 1000 заданий — 18 $. Время выполнения — 1 час.*

Соберите коллекцию записей разных голосов с разными интонациями и в разных условиях (шум, тишина, лес, дорога). Улучшайте технологию синтеза речи TTS (Text-to-Speech) с помощью полученных аудиоданных.

Стоимость 1000 заданий — 7 $. Время выполнения — 4 часа.*

Закажите расшифровку аудиофайлов и транскрипцию устной речи. Используйте полученные данные для улучшения моделей распознавания речи.

Стоимость 1000 заданий — 18 $. Время выполнения — 3 часа.*

Привлекайте исполнителей для определения эмоций, классификации звучащей речи по темам, идентификации событий в звуковых фрагментах или разговорах.

Стоимость 1000 заданий — 7,5 $. Время выполнения — 2 часа.*

Дайте исполнителям задание распознать текст на отсканированных документах. Эти данные помогут настроить технологию оптического распознавания символов (OCR).

Стоимость 1000 заданий — 15 $. Время выполнения — 3 часа.*

* Не является публичной офертой. Стоимость и время выполнения определяются заказчиками и зависят от типа задания, входных данных и других условий.
Краудсорсинг — ресурсы без ограничений
Для сбора и разметки данных необходимы ресурсы — время, силы и знания многих людей. Яндекс.Толока даёт доступ к неограниченному количеству исполнителей по всему миру. А умные инструменты и методики контроля качества делают процесс прозрачным и легко масштабируемым.
Статистика в реальном времени
Настройки платформы позволяют получать актуальную информацию о прогрессе. Используйте детальную аналитику, чтобы оптимизировать скорость, качество и бюджет ваших проектов.
Статистика по проектам в Яндекс.Толоке в реальном времени

Отзывы о Яндекс.Толоке

Используйте Яндекс.Толоку
Получайте размеченные данные для задач обработки естественного языка.
Начать
Cookie files
Yandex uses cookies to personalize its services. By continuing to use this site, you agree to this cookie usage. You can learn more about cookies and how your data is processed in the Privacy Policy.
Wed Apr 07 2021 16:30:00 GMT+0300 (Moscow Standard Time)