Jak kolonie mrówek mogą dać nam lekcję analizy dużych zbiorów danych

zmutowane mrówki zachowania społeczne mrówka
Jacob Filich/Flickr CC
Każdy, kto oglądał zeszłego lata Człowiek Mrówka film wie, że mrówki mają całkiem fajne „supermoce”. Jednak taki, który nie dostał się na hollywoodzkie spotkania scenariuszowe, to ten mrówki mają moc szacowania własnej gęstości populacji na podstawie tego, jak często wpadają na siebie podczas eksploracji okolica.

Przykładem sytuacji, w której może to być przydatne, jest poszukiwanie nowego gniazda – w tym przypadku zaledwie kilkudziesięciu odkrywcy są wysyłani, aby znaleźć wystarczająco dużą przestrzeń, a nie całą kolonię składającą się z setek lub tysięcy mrówki.

Polecane filmy

Ta długo badana umiejętność jest przedmiotem nowy papier przez naukowców z Laboratorium Informatyki i Sztucznej Inteligencji (CSAIL) MIT. Stworzyli algorytm, który replikuje zachowanie w komputerze i udowadnia, że ​​może to być niezwykle dokładny sposób przewidywania gęstości zaludnienia sieci.

„W informatyce istnieje intuicyjne poczucie, że algorytmy biologiczne są niezwykle solidne i dynamiczne” –

Camerona Musco, absolwentka elektrotechniki i informatyki na MIT oraz współautorka artykułu, mówi Digital Trends. „Chcieliśmy przyjrzeć się jednemu z tych systemów – w tym przypadku kolonii mrówek – i dowiedzieć się dokładnie, dlaczego są w stanie skutecznie działać, mimo że są tak złożone i odporne. To nas zainteresowało.”

Dlaczego ktoś miałby chcieć to zrobić? Jak wyjaśnia Musco, praca może mieć praktyczne zastosowanie w takich obszarach jak analiza dużych zbiorów danych – na przykład szacowanie składu jednej konkretnej orientacji politycznej wśród użytkowników mediów społecznościowych. „Tradycyjnie, jeśli jest włączone Facebook chciałeś oszacować liczbę Republikanów [na przykład], losowo wybrałeś podzbiór użytkowników i policzyłeś liczbę Republikanów” – kontynuuje Musco. „Ale nie możesz tego zrobić – nie ma głównej listy użytkowników, od których możesz pobierać próbki. Pokazujemy więc, że równie dobre może być po prostu losowe „przechodzenie” między użytkownikami — tj. zaczynanie od jednego użytkownika, przejście do znajomego, potem do znajomego znajomego itp. — i próbuj w ten sposób.”

W artykule wykazano, że tak zwane eksploracje „random walk” są prawie tak samo szybkie w określaniu gęstości populacji, jak bardziej ugruntowana metoda pobierania próbek.

„Ta praca służy dwóm celom” – kontynuuje Musco. „Z jednej strony daje nam to kilka interesujących pomysłów na temat wykorzystania systemów biologicznych do optymalizacji sieci komputerowych, co można zaobserwować w przypadku koncepcji inspirowanych biologią, takich jak sieci neuronowe. Jednocześnie możemy wykorzystać informatykę, aby pomóc biologom w rozwiązaniu niektórych problemów, które mają. Ludzie coraz częściej zaczynają robić to drugie rozwiązanie i jest to naprawdę przydatne — ponieważ zamiast patrzeć na zachowanie, skupiamy się na algorytmach wykrywania. To inny sposób myślenia o różnych rzeczach.”

Ulepsz swój styl życiaDigital Trends pomaga czytelnikom śledzić szybko rozwijający się świat technologii dzięki najnowszym wiadomościom, zabawnym recenzjom produktów, wnikliwym artykułom redakcyjnym i jedynym w swoim rodzaju zajawkom.