В Яндекс.Толоке вы можете организовать сбор и точную разметку обучающих данных высокого качества для улучшения алгоритмов NLP-моделей. Платформа позволяет ставить задачи по распознаванию именованных сущностей (NER), технологии синтеза речи (TTS), оптическому распознаванию символов (OCR) и многие другие.
Используйте Яндекс.Толоку, для оценки качества поиска и улучшения алгоритмов ранжирования.
Стоимость 1000 заданий — 18 $.
Время выполнения — 4 часа.*
Попросите исполнителей оценить тексты, классифицировать их по содержанию или другим характеристикам.
Стоимость 1000 заданий — 18 $. Время выполнения — 2 часа.*
Закажите разметку текстов по настроению и тональности. Используйте полученные данные для любых целей, например для анализа отзывов клиентов и фильтрации спама.
Стоимость 1000 заданий — 4,5 $.
Время выполнения — 1 час.*
Попросите исполнителей классифицировать запросы пользователей. С помощью полученных данных тренируйте чат-бота, голосового помощника или любую диалоговую систему.
Стоимость 1000 заданий — 4,5 $.
Время выполнения — 1 час.*
Обогащайте обучающую разговорную базу ИИ реальными репликами и диалогами, собранными исполнителями по вашим инструкциям и сценариям.
Стоимость 100 заданий — 6 $.
Время выполнения — 1 час.*
Используйте Яндекс.Толоку для задач распознавания именованных сущностей (NER), предложив исполнителям идентифицировать в тексте части речи, имена собственные и подобные языковые объекты.
Стоимость 1000 заданий — 18 $.
Время выполнения — 1 час.*
Соберите коллекцию записей разных голосов с разными интонациями и в разных условиях (шум, тишина, лес, дорога). Улучшайте технологию синтеза речи TTS (Text-to-Speech) с помощью полученных аудиоданных.
Стоимость 1000 заданий — 7 $.
Время выполнения — 4 часа.*
Закажите расшифровку аудиофайлов и транскрипцию устной речи. Используйте полученные данные для улучшения моделей распознавания речи.
Стоимость 1000 заданий — 18 $. Время выполнения — 3 часа.*
Привлекайте исполнителей для определения эмоций, классификации звучащей речи по темам, идентификации событий в звуковых фрагментах или разговорах.
Стоимость 1000 заданий — 7,5 $.
Время выполнения — 2 часа.*
Дайте исполнителям задание распознать текст на отсканированных документах. Эти данные помогут настроить технологию оптического распознавания символов (OCR).
Стоимость 1000 заданий — 15 $.
Время выполнения — 3 часа.*
Используйте Яндекс.Толоку, для оценки качества поиска и улучшения алгоритмов ранжирования.
Стоимость 1000 заданий — 18 $.
Время выполнения — 4 часа.*
Для сбора и разметки данных необходимы ресурсы — время, силы и знания многих людей. Яндекс.Толока даёт доступ к неограниченному количеству исполнителей по всему миру. А умные инструменты и методики контроля качества делают процесс прозрачным и легко масштабируемым.
Настройки платформы позволяют получать актуальную информацию о прогрессе. Используйте детальную аналитику, чтобы оптимизировать скорость, качество и бюджет ваших проектов.
Алексей Хахунов, технический директор и основатель Dbrain:
«Яндекс.Толока помогла нам решить задачу распознавания текста в документах, с которыми не справились алгоритмы. Мы отдаем анонимные фрагменты текста в Яндекс.Толоку, квалифицированные исполнители переписывают его и отправляют результат обратно в систему Dbrain для дальнейшего обучения ИИ. Благодаря этому нам удалось закрыть даже самые сложные случаи распознавания у клиентов».
Михаил Бурцев, заведующий лабораторией нейронных сетей и глубокого обучения МФТИ, DeepPavlov.ai:
«Современные технологии машинного обучения невозможны без большого объема обучающих примеров. Чтобы компьютер овладел естественным языком, человек должен „объяснить“, как правильно им пользоваться. Яндекс.Толока позволяет системам разговорного искусственного интеллекта, которые мы разрабатываем на Физтехе, общаться с большим количеством людей и становиться умнее».
Ангелина Галькевич, аналитик компании
Тинькофф:
«Мы используем Яндекс.Толоку, чтобы разметить данные для синтеза и распознавания речи. Через толокеров прошли уже десятки тысяч заданий с аудиофайлами, и результаты мы успешно использовали для обучения наших моделей. Нам нравится стоимость заданий, скорость выполнения и очень быстрая обратная связь.
Всё это позволяет оперативно тестировать разные способы разметки и выдвигать гипотезы, а затем выбирать оптимальный подход».
Алексей Хахунов, технический директор и основатель Dbrain:
«Яндекс.Толока помогла нам решить задачу распознавания текста в документах, с которыми не справились алгоритмы. Мы отдаем анонимные фрагменты текста в Яндекс.Толоку, квалифицированные исполнители переписывают его и отправляют результат обратно в систему Dbrain для дальнейшего обучения ИИ. Благодаря этому нам удалось закрыть даже самые сложные случаи распознавания у клиентов».
Михаил Бурцев, заведующий лабораторией нейронных сетей и глубокого обучения МФТИ, DeepPavlov.ai:
«Современные технологии машинного обучения невозможны без большого объема обучающих примеров. Чтобы компьютер овладел естественным языком, человек должен „объяснить“, как правильно им пользоваться. Яндекс.Толока позволяет системам разговорного искусственного интеллекта, которые мы разрабатываем на Физтехе, общаться с большим количеством людей и становиться умнее».
Ангелина Галькевич, аналитик компании
Тинькофф:
«Мы используем Яндекс.Толоку, чтобы разметить данные для синтеза и распознавания речи. Через толокеров прошли уже десятки тысяч заданий с аудиофайлами, и результаты мы успешно использовали для обучения наших моделей. Нам нравится стоимость заданий, скорость выполнения и очень быстрая обратная связь.
Всё это позволяет оперативно тестировать разные способы разметки и выдвигать гипотезы, а затем выбирать оптимальный подход».