Платформы для маркировки и аннотации могут не привлекать внимания, как новые заметные модели искусственного интеллекта. Но они являются необходимыми. Данные, на основе которых обучаются многие модели, должны быть помечены, иначе модели не смогут интерпретировать эти данные в процессе обучения.
Аннотация - это обширное мероприятие, требующее тысяч и миллионов аннотаций для более крупных и более сложных используемых наборов данных. Чтобы облегчить эту ношу, Эрик Ландо и Ульрик Хансен основали Encord, который они описывают как платформу для "разработки данных" для компаний, управляющих и подготовляющих свои данные для моделей искусственного интеллекта.
Теперь у компании есть дополнительные $30 миллионов, благодаря раунду финансирования серии C под руководством Next47. Пополнив кассу Encord до $50 миллионов, новые средства будут направлены на удвоение размера продукта Encord, команд инженеров и исследователей по искусственному интеллекту в течение следующих шести месяцев и расширение офисов компании в Сан-Франциско, сообщил Ландо TechCrunch.
"К концу года мы планируем увеличить нашу команду до 100 сотрудников, по сравнению с текущими 70", - добавил он. "У нас теперь два штаб-квартиры в Лондоне и Сан-Франциско с сотрудниками по всему миру."
Ландо начал работать с системами больших данных, проводя исследования в области физики элементарных частиц во время учебы в качестве студента в Стэнфорде. Хенсен работал на глобальных рынках в J.P. Morgan, где занимался производными финансовыми инструментами развивающихся рынков.
Хенсен говорит, что зародилась идея для Encord, когда он работал над проектами по обработке данных в рамках программы магистратуры по компьютерным наукам в Имперском колледже Лондона. Испытывая раздражение от затратного характера кураторства и маркировки данных, Хенсен встретился с Ландо, которого знал из предпринимательской среды Лондона, чтобы обсудить способы того, как они могли бы вместе решить проблему с данными.
"Объединяя экспертизу Хенсена в области разработки программного обеспечения с моими идеями относительно количественных исследований для автоматизации разработки данных, мы запустили первую итерацию продукта Encord во время и участия в программе Y Combinator весной 2021 года", - рассказал Ландо TechCrunch. "Платформа Encord оснащает предприятия инструментами для подготовки данных для искусственного интеллекта и оценки того, насколько эффективно эти данные поддерживают их модели."
С учетом того, что рынок аннотации и маркировки данных ожидается вырасти до $3.6 миллиарда к 2027 году, Encord - один из многих поставщиков, борющихся за контракты. Помимо слона в комнате - Scale AI - есть стартапы, такие как Datasaur, которые позволяют клиентам автоматически создавать модели на основе наборов меток; Heartex, который строит платформу для маркировки данных с открытым исходным кодом; и поставщик инструментов для аннотации данных Dataloop.
Ландо говорит, что Encord отличается универсальностью своей платформы.
Используя Encord, команды могут исследовать и визуализировать наборы данных - включая изображения, видео и голосовые данные - из частного и публичного облачного хранилища и сравнивать производительность различных моделей, обученных на одних и тех же наборах данных. Платформа пытается обнаружить проблемы с точностью модели и предложить дополнительные данные для обучения, которые могли бы помочь исправить эти проблемы.
"В отличие от урывками решений, которые затрагивают только определенные части вашего стека данных, Encord позволяет объединить все ваши рабочие процессы с данными в одной платформе", - сказал Ландо. "Благодаря этому объединению компании получают прослеживаемость, которая проливает свет на часто непрозрачный 'черный ящик' искусственного интеллекта, помогая понять, почему модель принимает определенные решения".
Стратегия Encord кажется работающей на данный момент. У компании 120 клиентов, включая Philips, шумный стартап по искусственному интеллекту Synthesia, и провайдеры медицинской помощи Cedars-Sinai и Northwell Health, а также контракты с не названными военными и правительственными агентствами. Ландо утверждает, что за последний год выручка Encord увеличилась в 4 раза и если бы компания не продолжала увеличивать количество сотрудников, она могла бы достигнуть собственности средств к 2025 году."Мы чувствуем противоположное замедление", - сказал Ландо. "Тем не менее, мы понимаем общие рыночные условия и принимаем осторожный подход к развертыванию капитала".
Среди других участников нового раунда финансирования также были Y Combinator, CRV и Crane Venture Partners.