Как загрузить задания
Обратите внимание
Документация на русском языке может быть устаревшей. Самые последние изменения доступны в документации на английском языке.
Чтобы загрузить файл с заданиями в пул:
-
Нажмите кнопку Загрузить данные.
-
Скачайте шаблон и добавьте свои данные.
Использовать пример данных
Если вы хотите посмотреть, как ваш проект будет выглядеть после запуска, но у вас еще нет заданий для разметки, вы можете загрузить в пул готовый пример данных. Примеры данных доступны для шаблонов:
- Классификация изображений
- Релевантность поиска товаров
- Распознавание объектов и выделение областей
- Кликбейт или нет?
Нажмите Использовать пример данных справа от надписи Прикрепите подготовленный файл с данными. Это позволит избежать дополнительных действий с файлами.
После того, как вы поработали с примером данных и вас все устроило, подготовьте свои данные и загрузите их в пул.
-
Прикрепите файл с заданиями.
-
Нажмите кнопку Продолжить.
-
Выберите способ распределения заданий и укажите количество заданий на странице. Подробнее об этих настройках см. в разделе Способы распределения заданий.
-
Нажмите кнопку Разделить задания на страницы.
-
Дождитесь результата обработки.
Чтобы удалить все задания в пуле, нажмите кнопку Удалить.
Ограничение
Можно добавить не более одного миллиона заданий в пул. Если вам надо загрузить больше заданий, создайте новый пул.
Советы и рекомендации
-
Устанавливайте количество заданий на странице в зависимости от сложности и времени на выполнение задания.
Рекомендуем распределять количество так, чтобы на одну страницу уходило не больше пяти минут.
-
Если получена ошибка обработки — формат данных внутри файла некорректный. Например, в файле есть лишние табы, не хватает строк, заголовков или кавычек.
В таком случае нажмите кнопку Отменить и исправьте ошибки, а затем загрузите файл снова.
Ошибки обработки
Если при загрузке файла возникла ошибка, воспользуйтесь таблицей.
Чтобы посмотреть лог обработки, нажмите Подробнее об ошибках загрузки. Лог обработки записан в формате JSON. Объекты внутри result
соответствуют номеру строки загружаемого файла. Строки, обработанные с ошибкой, имеют статус "success": false
.
Совет
Работать с большим логом удобнее, если скопировать его в текстовый редактор.
"parsing_error_of": "https://tlk.s3.yandex.net/wsdm2020/photos/2d5f63a3184919ce7e3e7068cf93da4b.jpg\t\t", "exception_msg": "the nameMapping array and the sourceList should be the same size (nameMapping length = 1, sourceList size = 3)"
Описание |
Как исправить |
Лишние знаки табуляции. Если в загружаемом файле после данных или ссылки стоит количество разделителей столбцов Например, когда во входных определен 1 столбец, а в файле после ссылки прописано ещё два знака табуляции |
Удалите лишние разделители столбцов, в приведенном выше примере ошибки — оба знака ( |
"exception_msg": "the nameMapping array and the sourceList should be the same size (nameMapping length = 4, sourceList size = 6)"
Описание |
Как исправить |
Не совпадает количество полей в заголовке и в строке. |
Проверьте, что:
|
"code": "VALUE_REQUIRED", "message": "Value must be present and not equal to null"
Описание |
Как исправить |
Не указано значение обязательного поля входных данных. |
Проверьте, что заполнены все столбцы с обязательными полями входных данных. |
"code": "INVALID_URL_SYNTAX", "message": "Value must be in valid url format"
Описание |
Как исправить |
Данные в поле с типом «ссылка» («url») некорректны. |
Проверьте, что:
|
"exception_msg": "unexpected end of file while reading quoted column beginning on line 2 and ending on line 4"
Описание |
Как исправить |
В строке стоит непарная кавычка. |
Проверьте, что все кавычки экранированы. |
Что дальше
-
Узнайте про способы распределения заданий по страницам.
-
Если вы еще не разметили контрольные и обучающие задания в файле, разметьте задания в интерфейсе.
Решение проблем
Если заголовки столбцов некорректны, файл будет полностью отклонен. В остальных случаях указано количество заданий с ошибками обработки.
Проверьте поле hint
. Для обычных заданий это поле должно быть пустым.
Количество заданий зависит от сложности и длительности выполнения. Не делайте страницы заданий слишком большими: они неудобны для исполнителей (например, при сбоях в соединении с интернетом) и не пользуются спросом.
Попробуйте выполнить задания сами, попросите своих друзей и коллег. Найдите среднее время выполнения и добавьте к нему 50%.
Ошибка будет возникать, если на вход ожидается тип URL, а приходит строка.
Причин может быть две:
-
Входное поле имеет тип "ссылка".
-
Пул работает на неактуальной версии проекта. То есть создан до того, как вы изменили тип входного поля.
Зависит от задания. Технически можно много.
Но, во-первых, исполнители неохотно берутся за задания, которые требуют много времени на выполнение. То есть, они скорее сделают 10 заданий по одной минуте, чем одно задание на 10 минут.
Во-вторых, при большом количестве заданий на странице может быть проблема с загрузкой файлов для разметки. Например, картинок.
Третий момент — контроль качества и оценка выполнения всей страницы. Если вы используете дооценку заблокированных исполнителей, то лучше дробить задание на более мелкие части, чтобы в переразметку отправлялось меньше заданий. Это позволит уложиться в бюджет.
Загруженные ссылки на картинки в файле Толока разделит на страницы в зависимости от того, какой способ распределения заданий вы выбрали. Подробнее читайте на странице Способы распределения заданий.
Task — это отдельное задание. Task suite — страница с заданиями. Исполнитель получает оплату за страницу заданий.