在 Toloka 我们致力于发掘 AI 机会。每天,我们的研究员都在应对紧迫的 AI 和 ML 挑战,
在重要的全球活动中发言并在科学期刊上发表他们的研究结果。想了解更多,请往下滚动。
浏览我们的一些最新报告。
我们的数据集具有平衡的年龄和性别分布并使用著名的IMDB-WIKI数据集作为真实值。我们描述我们的数据集是如何构建的,然后比较几种基线方法并确定对模型评估的适用性。
特定领域数据是将机器学习系统从基准成功转移到现实生活的关键。众包已成为针对图像分类等简单问题进行廉价且省时的数据收集的标准工具之一:这在很大程度上归功于聚合方法研究的进步。
在本篇文章中,我们介绍了Crowd-Kit —— 一个通用众包计算控制工具包。它在Python 中为众包提供了计算质量控制算法的有效实现,包括不确定性量度和众包共识方法。
本文回顾了致力于解决此问题的众包音频转录共享任务,并与 VLDB 2021 会议的人群科学研讨会共同组织。
我们针对看到了可用任务列表并希望选择其中一个来执行的众包平台用户研究了预测未来每小时收入和任务完成时间的问题。
在本文中,我们着手解决通过 CAPTCHA 标记文本图像的问题,CAPTCHA中用户识别通常是不可能的。 我们提出了一种新算法来聚合通过 CAPTCHA 收集的多个猜测。
我们定期在一些全球最大的人工智能会议上举办教程和领导研讨会。
我们在持续改进和国际合作中茁壮成长。 如果您想合作,请在 LinkedIn 上联系我们。
Toloka 与世界各地的大学合作,整合人群科学技术。