Funkcja rozpoznawania w danych naukowych

Original: http://www.cs.colorado.edu/~lizb/features.html

 

 

Opis projektu:

Obecnie tempo, w jakim mogą być generowane dane symulacji znacznie przewyższa tempo, w których naukowcy mogą wglądu i analizowania go. Technik wizualizacji 3D zapewniają częściowe rozwiązanie tego problemu, umożliwiając eksperta skanować dużych zestawów danych, identyfikacji i klasyfikacji ważne cechy i trafia w dziedzinach, które wymagają bliżej. Biegłość w tego typu analizy, jednak wymaga znacznych szkolenia w różnych dyscyplinach.Ekspert analityk musi być obeznany z nauką domeny, symulacji numerycznych, metod wizualizacji, formatów danych i szczegółów, jak przenieść dane w heterogenicznych sieciach obliczeniowych i pamięci, między innymi. W tym samym czasie, sama objętość tych zestawów danych czyni to zadanie nie tylko żmudne, a również bardzo powtarzalny. Jeden logiczny krok jest do automatyzacji procesu rozpoznawania funkcja i charakterystyka tak naukowcy mogą spędzić czas analizy nauki za regionów obiecujących i nietypowych w swoich danych, a nie zmaganiem się mechanicznych szczegółów analizy danych.Celem tego projektu było stworzenie narzędzia, które czyni.

Ogólne definicje funkcji są bardzo trudne do wyrażenia; większość z tych, w literaturze spaść z powrotem na niejasnych słów, takich jak `niezwykły ” lub ” ciekawe ” lub ” spójny.” Funkcje są często o wiele łatwiej rozpoznać niż opisać, i są one również bardzo domain- zależne. Struktury, w którym analityk specjalista wybiera się skupić — a także sposób, w którym ma powodów nimi — muszą zależeć od fizycznych, które są zaangażowane, jak również od charakteru badania. Meteorolodzy i oceanografowie interesuje burz i gyres, a astrofizycy szukać galaktyk i pulsarów i biologów molekularnych klasyfikacji części cząsteczek jak alfa-helis i beta-arkuszy. Typy danych różnią — ciśnienie, temperatura, prędkość, wirowość itp — i krytyczna część wiedzy eksperckiej analityka jest wiedzieć, jak różne funkcje w różnych oczywistych pól danych.

Naszym celem było stworzenie systemu ogólnego przeznaczenia i funkcji charakteryzacji do wykrycia go z różnych konkretnych przypadkach problemów w różnych dziedzinach. W pierwszym etapie, skupiamy się na danych analizy metodą elementów skończonych z symulacji komputerowych stałych problemów mechaniki. Ponieważ chcemy, aby stworzyć praktyczne i przydatne narzędzie, pracujemy z danymi z wdrożonych symulatorów, w formacie, w świecie rzeczywistym: asci DMF (modele danych i formaty), lingua franca używane przez kilka laboratoriów krajowych w USA czytać i zapisu plików danych dla dużych projektów symulacyjnych. Wybór ten podniósł kilka interesujących kwestii interoperacyjności, które są opisane w dokumentach cytowanych poniżej.Migawka danych DMF składa się z opisu geometrycznego siatki (2D lub 3D na ogół) i kilka informacji na temat fizyki w każdym punkcie siatki. Oto przykład takiego snapshot– prosty siatkowa powierzchni 3D:

 

Biorąc pod uwagę takie migawki, naszym celem jest, aby scharakteryzować cechy nim i wygenerować raport znaczący. W tym przypadku, powierzchnia jest w zasadzie gładka, z wyjątkiem jednego “kolca”. Kolce są interesujące zarówno ze względów numerycznych i fizycznych, a nasze algorytmy używać w normalnych wzorców do sąsiednich elementów siatki, aby je znaleźć. Poniższa ilustracja przedstawia tę samą powierzchnię, ale z każdego elementu siatki świadczonych w kolorze, który wskazuje, ile jej wektor normalny odbiega od średniej z wektorów normalnych sąsiadów:

 

Aby zrozumieć, co sprawia, że ​​funkcja, zaczęliśmy dzięki ścisłej współpracy z naukowcami domen zidentyfikować proste ontologię wyróżniających spójnych struktur, które pomagają im zrozumieć i ocenić dynamikę problemu pod ręką. (Formalnie Ontologia stara się destylować najbardziej podstawowych pojęć systemu dół na zestaw dobrze zdefiniowanych rzeczowników i czasowników – obiektów i operatorów -. Wspierających skuteczną argumentację o systemie) W aplikacjach elementów skończonych, jak w wielu inni, że są dwa rodzaje funkcji, które są szczególnie interesujące dla nas:

tych, które naruszają ciągłość i płynność założeń, które są nieodłączne w obu praw fizyki i symulacji numerycznej: kolce, pęknięcia, rysy, zmarszczki itp — albo w geometrii siatki lub w zmiennych fizycznych.
tych, które naruszają wyższego poziomu praw fizycznych, takich jak wymóg normalne siły jest równa i przeciwnie, gdy dwie powierzchnie spotkać (takie naruszenia są określane jako “ problemów kontaktowych “”).
Zauważ, że zakładamy, że użytkownicy ekspertów z tych funkcji może opisać matematycznie; wiele podejść do automatycznego wykrywania cech nie robią tego założenia.Proces inżynierii wiedzy i algorytmów, których używamy do hermetyzacji wynikające charakteryzacje, które opierają się na dość podstawowe matematyki, są opisane w dokumentach cytowanych poniżej, podobnie jak wyniki badań.
osób:

Nancy Collins, MS Student, Informatyki
Stephanie Boyles, MS Student, Informatyki
Andre Smirnov, MS Student, Informatyki.
Profesor Liz Bradley
dokumenty:

V. Robins, J. Abernethy, N. Rooney i E. Bradley, “Topologia i Inteligentna analiza danych”, Inteligentna analiza danych 8: 505-515 (2004)
E. Bradley, N. Collins, i W. Kegelmeyer, “Charakterystyka funkcji w zbiorów danych naukowych,” IDA-01 (Międzynarodowe Sympozjum na temat inteligentnej analizy danych), Lizbona; Września 2001.
Pomoc:

Program DOE ASCI przez Level 3 dotacji z Sandia National Laboratories
Packard Drużyna w Science and Engineering.
Wszelkie opinie, konkluzje i wnioski lub rekomendacje wyrażone w niniejszym materiale należą do autora (ów) i nie muszą odzwierciedlać poglądów tych organizacji.

Comments are closed.