Diz 78 cz

From DCEwiki
Jump to navigation Jump to search

Hledání, učení a detekce vzorů v časových řadách

Autor: Martin Ron

Úlohy strojového učení typicky vyžadují velký objem dat pro učení svých modelů. Tato dizertace se zabývá analýzou časových řad, které jsou častým typem dat zaznamenávaných v průmyslu. Cílovou aplikací je modelování a analýza chování strojů. Tyto modely chování potřebují přesně strukturované trénovací datové sady, které jsou typicky připravované ručně. To je nákladný a únavný proces náchylný k chybám. Tato komplikace znesnadňuje rozšíření aplikací takových modelů chování v průmyslu, což nás motivovalo ke zkoumání celkového procesu stochastického modelování chování strojů s cílem co nejvíce automatizovat krok nasazení těchto modelů v praxi.

Náš výzkum začal úlohou modelování chování průmyslového robotického manipulátoru za použití dat o průběhu jeho spotřeby elektrické energie, kde bylo zapotřebí segmentovat časové řady spotřeby robotu na jednotlivé robotické operace. Tato analýza posloužila jako základ pro výzkum optimálního plánování robotických operací za účelem snížení spotřeby elektrické energie. Cílovou doménu našeho řesení jsme rozšířili ze spotřeb průmyslových robotů na obecné opakující se vzory chování v časových řadách. Naše výsledky jsou primárně ověřovány na případech průmyslových robotů, ale naše metody jsou obecné a jsou aplikovatelné na širokou škálu průmyslových prolémů, což jsme také ověrili na průmyslové aplikaci na vsádkových pecích.

Abychom zredukovali nutnost ručních zásahů do modelovacího procesu, zformulovali jsme zadání segmentace časové řady jako úlohu odhalování motivů (dále jen motif discovery). Motif discovery hledá v časových řadách opakující se vzory, a pokud není použita jeho aproximační varianta, má motif discovery kvadratickou výpočetní složitost. Jedním z našich hlavích přínosů je nová stochastická předfiltrační metoda, která významně snižuje výpočetní složitost motif discovery úlohy, a to na lineární složitost pro většinu časových řad z praxe, přičemž vysoká kvalita nalezených motivů zůstává zachována. Na druhém konci procesu detekce vzorů jsme navrhli metodu preferování spojitosti v parametrech, která značně snižuje množství potřebných trénovacích dat potřebných pro naučení časově proměnlivých skrytých Gauss-Markovských modelů. Tyto modely se vyznačují výbornými klasifikačními a odvozovacími schopnostmi, ale málokdy je k dispozici dostatek dat k jejich dobrému natrénování. Náš přínos překonává toto omezení efektivním získáváním více informace z menšího množství dat. Celá tato dizertační práce vyústila v nástroj Motif Discovery and Detection Framework, který řeší celý proces tvorby a aplikace modelů chování strojů.

Dizertace je strukturovaná podle postupu výzkumu. Každá kapitola obsahuje rešerši současné problematiky týkající se tématu dané kapitoly, samostatnou definici cílů a také diskuzi o výsledcích simulací a experimentů. Tato struktura podtrhuje modularitu našeho výzkumu stejně jako i modularitu nástroje Motif Discovery and Detection Framework, což má za cíl podpořit přejímání prezentovaných výsledků do praxe.


Disertační práce 2023