Генераторы литературного контента на рынке финансовой информации

Друзья, с момента основания проекта прошло уже 20 лет и мы рады сообщать вам, что сайт, наконец, переехали на новую платформу.

Какое-то время продолжим трудится на общее благо по адресу https://n-n-n.ru.
На новой платформе мы уделили особое внимание удобству поиска материалов.
Особенно рекомендуем познакомиться с работой рубрикатора.

Спасибо, ждём вас на N-N-N.ru

Появление промышленных генераторов литературного контента (ГЛК) связано с успехами в создании алгоритмов синтеза и обработки текстовой информации на основе методов ИИ. После многих десятилетий научных исследований, в начале 2010-х гг. почти одновременно несколько конкурирующих исследовательских групп вывели на рынок свои первые промышленные системы ГЛК. Сегодня же использование роботов в финансовой журналистике уже никого не удивляет.

Одним из лидеров в этом секторе является американская компания Narrative Science (см. на ХАБРе за 2011 г.). Её первый коммерчески успешный ГЛК получил название Quill. Сама компания была создана в 2010 г. в рамках эксперимента Северо-Западного университета (США) по машинной трансформации отчетов о бейсбольных матчах в статьи традиционного формата, привычные для спортивной прессы. В 2011 г. ей удалось привлечь первые $6 млн. инвестиций для изучения технологий машинного написания статей. В 2013 г. привлекли еще $11,5 млн. на продолжение работ. В 2017 г. программные версии Quill уже были способны генерировать новостные статьи, финансовые отчеты компаний и даже заголовки статей без участия человека.

В 2020 г. году компания вывела на рынок новый продукт под названием Lexio. Любопытно, что если Quill превращал данные пользователя в «Ваш любимый дэшборд», то Lexio, наоборот, «…больше не заставит Вас продираться через дэшборды и вникать в таблицы». Это связано с тем, что, как выяснилось, дэшборды уже порядком поднадоели клиентам, и они хотят читать обычный «человеческий» текст. Оба продукта пользуются популярностью, т.к. их производительность многократно превышает возможности человека.

Narrative Science предоставляет свои ГЛК в аренду главным образом корпоративным клиентам, которым необходимо генерировать финансовые отчеты объемом 10–15 страниц на основе актуальной информации. Как правило, подготовка такого отчета человеком-специалистом занимает 2–3 недели. Производительность Quill и Lexio, при прочих очевидных преимуществах, составляет миллионы слов в день. Постоянными клиентами Narrative Science являются Forbes, Credit Suisse, Groupon, T. Rowe Price, ASAA и еще около 70 компаний.

Стоимость генерации текста с помощью продуктов Narrative Science зависит от типа статьи, который, в свою очередь, базируется на интерпретации конкретного набора данных. Компанией получено 45 патентов США на изобретения систем и методов ГЛК, и еще 45 патентных заявок находятся в стадии рассмотрения. Основная часть НИОКР была выполнена при грантовой поддержке Национального научного фонда США.

Следующая технология, которую разработала для себя компания Washington Post, получила название Heliograf. За последние годы опубликованы десятки тысяч статей, написанных с помощью этого ГЛК. Heliograf способен генерировать новостные, финансовые и подобные им отчеты, и даже посты для социальных медиа. Услуги по использованию технологии Heliograf компания Washington Post предоставляет через специализированную платформу Arc Publishing. Руководитель информационного подразделения компании сообщил в прессе, что доходность от использования Heliograf в годовом исчислении составляет (умопомрачительные) 60% – 80%.

Еще одну технологию Wordsmith (в буквальном переводе – «словесная кузница»), созданную компанией Automated Insight, успешно осваивает The Associated Press (АР) – одна из старейших новостных сетей США. По сообщениям самой АР, производительность Wordsmith также является очень высокой. Тем не менее, этот генератор пока не может работать в полностью автономном режиме. Для получения нужного результата оператор должен:

  • ввести исходные данные в программу и задать ей несколько информационных «опорных точек»;
  • составить (или выбрать готовый) шаблон статьи;
  • проверить и отредактировать предварительный вариант вёрстки текста;
  • прямо из приложения отправить статью в публикацию.

Таким образом, оператор, по сути, должен создать свои правила, шаблон статьи и некоторые опорные точки. В результате такой полуручной работы удается получить довольно высокое качество текста. Приложение Wordsmith способно работать на двадцати языках и продолжает быстро развиваться. Инвесторами компании Automated Insight стали крупные игроки рынка, включая Microsoft, Yahoo!, Samsung, Comcast, и другие. Стоимость программного обеспечения ГЛК в среднем пока достаточно высока. Однако с выходом на рынок множества конкурентных разработок цены на такие продукты неизбежно снижаются. Судя по темпам внедрения научных разработок в этой сфере, в скором времени ГЛК бут доступны в такой же степени, как современные текстовые редакторы MS Office или Adobe Acrobat.

Прочие крупные игроки рынка финансовой информации также раскрыли сведения об использовании роботов. В частности, оказалось, что уже почти треть публикаций медиагиганта Bloomberg News готовится с использованием собственной системы ИИ, получившей название Cyborg. Так же, как Wordsmith, эта система используется репортерами при подготовке тысяч корпоративных финансовых отчетов, помогая Bloomberg News в нелегкой конкурентной борьбе с агентством Reuters, а также с новыми участниками информационной гонки – продвинутыми хедж-фондами, которые также используют системы на базе ИИ для поставки свежих новостей и аналитики своим клиентам.

Наконец, компания Forbes недавно сообщила, что тестирует собственную систему Bertie, которая помогает журналистам с написанием черновых вариантов и шаблонов статей.

Влияние ГЛК на фондовый рынок

Количественная оценка степени воздействия ГЛК на фондовый рынок представляет большой научный интерес.

Подробнее
Пожалуйста, оцените статью:
Ваша оценка: None Средняя: 5 (1 vote)
Источник(и):

Хабр