Московская компания создала программу для очистки данных с алгоритмами нечеткой логики.
Следи за успехами России в Телеграм @sdelanounas_ruМосковский технологический стартап ООО «Кнодль» (Knowledge Definition Language) 7 августа представил на сайте разработчика бесплатную демоверсию программы для дедупликации данных. Она предназначена для компаний, работающих с несколькими базами данных. Пробные загрузки ограничены по количеству записей, но для малого и среднего бизнеса этого достаточно, чтобы очистить базы данных от дублей.
Дедупликация — это процесс удаления дублирующихся данных в информационных системах. Проще говоря, это метод очищения базы данных от повторяющихся записей, чтобы сохранить только уникальные и полезные данные.*
Например, если в телефонной книге одно и то же имя и номер телефона записаны несколько раз, то дедупликация оставит только одну запись. Это помогает сократить объем хранимой информации и повысить точность работы систем, которые используют эти данные.
Рынок Проблема дублирующихся данных актуальна не только для бизнеса, но и для государственных структур и некоммерческих организаций. Совокупный рынок услуг по дедупликации данных оценивается в:
— Россия: 20-30 млрд рублей ($200 — $300 млн)
— США: $4,5 — $5 млрд
— Европа: $2,5 — $3 млрд
— Китай: $1,5 — $2 млрд
— Саудовская Аравия: $0,15 — $0,2 млрд
— ОАЭ: $0,1 — $0,15 млрд
— Индия: $0,8 — $1 млрд
В зависимости от масштаба цифровой экономики и государственного управления, спрос на такие услуги варьируется. Основные пользователи — сборочные предприятия, маркетплейсы, розничные компании, библиотеки и государственные ведомства. Эти организации имеют огромную и разнообразную номенклатуру товаров, контрагентов и клиентов, что требует работы с различными базами данных.
Из-за различий в системах хранения данных и человеческого фактора, сопряжение и переход от одной базы к другой могут быть сложной задачей, решение которой часто занимает много времени у ИТ-специалистов.
Предлагаемое решение, основанное на алгоритмах нечеткой логики, позволяет бизнесу и госструктурам экономить вычислительные мощности и время. В отличие от нейросетевых решений, оно проще в реализации и использовании.
«Использование решений на базе технологии KnoDL значительно снижает затраты на интеграцию различных информационных систем за счёт решения сложной задачи по сопоставлению справочных данных», — отмечает начальник отдела разработки информационных систем АО «НТТ» Андрей Шапринский.
«Этот инструмент является мощным решением для работы с большими данными», — добавляет Вадим Лукичёв, доцент кафедры И4 «Радиоэлектронные системы управления» БГТУ «ВОЕНМЕХ» им. Д.Ф. Устинова.
Аналоги Среди зарубежных компаний, предоставляющих аналогичные услуги по дедупликации данных, можно выделить WinPure, MLtek Limited, Match2Lists (Великобритания), Druva, Narrative, Senzing (США), ZaapIT (Израиль). В России это «Форсайт. Аналитическая платформа», Data Science Workspace от «Техносерв», ГК «Иннотех».
Разработчики программного обеспечения утверждают, что их продукт не требует предварительной подготовки данных или исправления орфографических ошибок, в то время как большинство существующих решений требуют нормализации данных — процесса приведения разных масштабов и единиц измерения к единому виду для упрощения сравнения и анализа.
Особенности Программа «Кнодль» обеспечивает интеграцию данных из разных источников, быструю первичную оценку данных без предварительной подготовки и сложной настройки, гибкость и адаптивность к изменениям. Алгоритмы, составляющие ядро программы, уже сейчас позволяют внедрять Системы Поддержки Принятия Решений (СППР), которые конкурируют с нейросетевыми технологиями, но требуют гораздо меньших ресурсов и времени на обработку запросов.
Международный опыт Специалисты, разработавшие технологию «Кнодль», утверждают, что аналогов их решения нет даже в арсенале DARPA (Управление перспективных исследовательских проектов Министерства обороны США) и других технологических институтов.
«Они, американцы, выбрали более сложный и дорогой путь», — говорит ведущий разработчик компании «Кнодль» Дмитрий Поспелов.
Создание продукта на основе алгоритмов, разработанных российскими учеными, даёт импульс продвижению отечественных инновационных технологий на мировой арене.
https://mashnew...koj-logiki.html
Кстати, а вы знали, что на «Сделано у нас» статьи публикуют посетители, такие же как и вы? И никакой премодерации, согласований и разрешений! Любой может добавить новость. А лучшие попадут в телеграмм @sdelanounas_ru. Подробнее о том как работает наш сайт здесь👈
20.09.2411:49:35