http://www.ras.ru/news/shownews.aspx?id=6c469025-f9f4-402d-ab30-01da106895fc&print=1© 2024 Российская академия наук
Сотрудники ФИЦ «Информатика и управление» РАН, факультета вычислительной математики и кибернетики Московского государственного университета им. М.В. Ломоносова МГУ, Московского центра фундаментальной и прикладной математики, а также Российского университета дружбы народов представили результаты исследования, посвящённого развитию вероятностно-информированного подхода в машинном обучении для прогнозирования характеристик сетевого трафика и детектирования событий в нем.
Новый метод опубликован в журнале Computer Networks. Развитие предлагаемых методов актуально для решения задач оптимизации производительности телекоммуникационных сетей и управления качеством обслуживания. Это способствует повышению эффективности, надежности и устойчивости к внешним сбоям, а также снижению затрат на эксплуатацию и обслуживание.
Сети пятого (5G) и последующих поколений будут обслуживать большое количество пользователей, предоставляя широкий спектр приложений с высокими скоростями передачи данных и строгими требованиями к качеству обслуживания. Чтобы удовлетворить эти требования, сеть должна поддерживать точную реконструкцию исторических событий, обнаружение инцидентов в реальном времени и прогнозирование будущих событий, связанных с качеством обслуживания. Это необходимо для динамического распределения сетевых ресурсов для различных приложений посредством «нарезки» сети.
«Мы разработали инновационный метод, который сочетает сильные стороны машинного обучения и статистических моделей. Это позволило значительно повысить качество обработки сетевого трафика», — отметил Андрей Горшенин, доцент кафедры математической статистики факультета ВМК МГУ, главный научный сотрудник и руководитель отдела ФИЦ ИУ РАН.
В работе предложена регрессионная модель глубокой гауссовой смеси, в которой сначала выполняется предварительная кластеризация на основе нейронной сети и конечных нормальных смесей. Затем эта информация используется в качестве входных данных для алгоритмов машинного обучения с учителем, таких как градиентный бустинг. Подобный подход, являющийся одним из возможных вариантов вероятностного информирования моделей машинного обучения, позволил значительно повысить точность прогнозирования. Так, в ходе тестирования на реальных данных мобильных операторов связи было продемонстрировано уменьшение ошибок в метриках RMSE и MAPE на 13% и 35,7%, соответственно, по сравнению со стандартными для данных задач алгоритмами машинного обучения и рекуррентными нейронными сетями LSTM.
Основные полученные результаты включают вероятностно-информированный подход к машинному обучению для телекоммуникационных сетей, регрессионную версию глубоких гауссовых смесей — первую реализацию данной нейросетевой архитектуры для задач обучения с учителем, а также ансамблевый метод детектирования аномальных наблюдений на базе вероятностной модели сетевого трафика, основанной на обобщенном гамма-распределении, элементов математической теории экстремальных значений и композиции алгоритмов машинного обучения.
«Наше исследование показывает, что вероятностно-информированные подходы оказываются точнее и вычислительно эффективнее в задачах анализа данных современных сетей связи. Их дальнейшее развитие видится в разработке более сложных глубоких архитектур и расширении областей применения», — добавляет Андрей Горшенин.
Новый метод значительно повышает точность и эффективность анализа данных в телекоммуникационных сетях, а также снижает вычислительные затраты.
Источник: МГУ.