Co to jest sztuczna sieć neuronowa? Oto wszystko, co musisz wiedzieć

sztuczna sieć neuronowa
Michał Tyka

Jeśli spędziłeś trochę czasu na czytaniu o sztuczna inteligencja, prawie na pewno słyszałeś o sztucznych sieciach neuronowych. Ale czym właściwie jest jeden? Zamiast zapisywać się na kompleksowy kurs informatyki lub zagłębiać się w bardziej szczegółowe zasoby dostępne online, zapoznaj się z naszym poręcznym przewodnikiem dla laików, aby szybko i łatwo zapoznać się z tą niesamowitą formą maszyny uczenie się.

Co to jest sztuczna sieć neuronowa?

Sztuczne sieci neuronowe są jednym z głównych narzędzi wykorzystywanych w uczeniu maszynowym. Jak sugeruje „neuralna” część ich nazwy, są to systemy inspirowane pracą mózgu, których zadaniem jest naśladowanie sposobu, w jaki uczymy się my, ludzie. Sieci neuronowe składają się z warstwy wejściowej i wyjściowej, a także (w większości przypadków) warstwy ukrytej składającej się z jednostek, które przekształcają dane wejściowe w coś, z czego może skorzystać warstwa wyjściowa. Są doskonałymi narzędziami do wyszukiwania wzorców, które są zbyt złożone lub zbyt liczne, aby programista mógł je wydobyć i nauczyć maszynę rozpoznawać.

Polecane filmy

Podczas gdy sieci neuronowe (zwane także „perceptronami”) istnieją od lat czterdziestych XX wieku, dopiero w ciągu ostatnich kilku dziesięcioleci stały się one główną częścią sztucznej inteligencji. Wynika to z pojawienia się techniki zwanej „propagacją wsteczną”, która umożliwia sieciom dostosowywanie ukrytych warstw neuronów w sytuacjach gdzie wynik nie odpowiada oczekiwaniom twórcy — jak sieć zaprojektowana do rozpoznawania psów, która błędnie identyfikuje kota, na przykład przykład.

Powiązany

  • Co to jest pamięć RAM? Oto wszystko, co musisz wiedzieć
  • Nvidia RTX DLSS: wszystko, co musisz wiedzieć
  • Wymagania systemowe Stable Diffusion PC: czego potrzebujesz, aby go uruchomić?

Kolejnym ważnym postępem było pojawienie się sieci neuronowych głębokiego uczenia się, w których są różne warstwy sieci wielowarstwowej wyodrębniają różne cechy, dopóki nie rozpoznają, czego szukają Do.

Brzmi dość skomplikowanie. Czy możesz to wyjaśnić, jakbym miał pięć lat?

Aby uzyskać podstawowe pojęcie o tym, jak uczy się sieć neuronowa głębokiego uczenia, wyobraźmy sobie linię fabryczną. Po wprowadzeniu surowców (zestawu danych) są one następnie przekazywane na przenośnik taśmowy, przy czym każdy kolejny przystanek lub warstwa wydobywa inny zestaw cech wysokiego poziomu. Jeśli sieć ma rozpoznawać obiekt, pierwsza warstwa może analizować jasność jego pikseli.

Następna warstwa mogłaby następnie zidentyfikować dowolne krawędzie obrazu na podstawie linii podobnych pikseli. Następnie kolejna warstwa może rozpoznawać tekstury i kształty itd. Zanim dotrzemy do czwartej lub piątej warstwy, sieć głębokiego uczenia się utworzy złożone detektory cech. Może wykryć, że pewne elementy obrazu (takie jak para oczu, nos i usta) często występują razem.

Po wykonaniu tej czynności badacze, którzy przeszkolili sieć, mogą nadać wynikom etykiety, a następnie zastosować propagację wsteczną w celu skorygowania wszelkich popełnionych błędów. Po pewnym czasie sieć może wykonywać własne zadania klasyfikacyjne bez konieczności każdorazowej pomocy człowieka.

Poza tym istnieją różne rodzaje uczenia się, np nadzorowany Lub uczenie się bez nadzoru Lub uczenie się przez wzmacnianie, w którym sieć uczy się sama, próbując zmaksymalizować swój wynik — jak to zapadło w pamięć Bot grający w gry na Atari firmy Google DeepMind.

Ile jest typów sieci neuronowych?

Istnieje wiele typów sieci neuronowych, z których każdy ma własne specyficzne przypadki użycia i poziomy złożoności. Najbardziej podstawowym typem sieci neuronowej jest tzw wyprzedzająca sieć neuronowa, w którym informacja przemieszcza się tylko w jednym kierunku od wejścia do wyjścia.

Szeroko stosowanym typem sieci jest nawracająca sieć neuronowa, w którym dane mogą przepływać w wielu kierunkach. Te sieci neuronowe mają większe zdolności uczenia się i są powszechnie stosowane do bardziej złożonych zadań, takich jak nauka pisma ręcznego lub rozpoznawanie języka.

Istnieje również splotowe sieci neuronowe, Sieci maszyn Boltzmanna, Sieci Hopfieldai wiele innych. Wybór odpowiedniej sieci do Twojego zadania zależy od danych, na podstawie których musisz ją trenować, oraz od konkretnej aplikacji, którą masz na myśli. W niektórych przypadkach może być pożądane zastosowanie wielu podejść, na przykład w przypadku trudnego zadania, takiego jak rozpoznawanie głosu.

Jakie zadania może realizować sieć neuronowa?

Szybki przegląd naszych archiwów sugeruje, że właściwym pytaniem powinno być „jakie zadania żargon sieć neuronowa?” Z sprawienie, by samochody poruszały się autonomicznie po drogach, Do generując szokująco realistyczne twarze CGI, do tłumaczenia maszynowego, do wykrywania oszustw, do czytając w naszych myślach, do rozpoznawania, kiedy a kot jest w ogrodzie i włącza zraszacze; Sieci neuronowe stoją za wieloma największymi postępami w dziedzinie sztucznej inteligencji.

Jednak ogólnie rzecz biorąc, są one przeznaczone do wykrywania wzorców w danych. Konkretne zadania mogą obejmować klasyfikację (klasyfikację zbiorów danych w predefiniowane klasy), grupowanie (klasyfikację danych w różne niezdefiniowane kategorie) i przewidywanie (wykorzystywanie przeszłych wydarzeń do odgadywania przyszłych, takich jak giełda lub box filmowy biuro).

Jak dokładnie „uczą się” różnych rzeczy?

Podobnie jak uczymy się na podstawie doświadczeń życiowych, sieci neuronowe wymagają danych, aby się uczyć. W większości przypadków im więcej danych można przesłać do sieci neuronowej, tym będą one dokładniejsze. Pomyśl o tym jak o każdym zadaniu, które wykonujesz w kółko. Z biegiem czasu stopniowo stajesz się bardziej wydajny i popełniasz mniej błędów.

Kiedy badacze lub informatycy rozpoczynają szkolenie sieci neuronowej, zazwyczaj dzielą swoje dane na trzy zestawy. Pierwszy to zbiór szkoleniowy, który pomaga sieci ustalić różne wagi pomiędzy jej węzłami. Następnie dostrajają go, korzystając z zestawu danych walidacyjnych. Na koniec użyją zestawu testowego, aby sprawdzić, czy uda mu się przekształcić dane wejściowe w pożądane dane wyjściowe.

Czy sieci neuronowe mają jakieś ograniczenia?

Na poziomie technicznym jednym z większych wyzwań jest czas potrzebny na uczenie sieci, co w przypadku bardziej złożonych zadań może wymagać znacznej ilości mocy obliczeniowej. Największym problemem jest jednak to, że sieci neuronowe to „czarne skrzynki”, do których użytkownik wprowadza dane i otrzymuje odpowiedzi. Mogą doprecyzować odpowiedzi, ale nie mają dostępu do dokładnego procesu decyzyjnego.

Jest to problem, którym zajmuje się wielu badaczy aktywnie pracować, ale stanie się to jeszcze bardziej naglące, w miarę jak sztuczne sieci neuronowe będą odgrywać coraz większą rolę w naszym życiu.

Zalecenia redaktorów

  • Laptopy z ładowaniem USB-C: oto, co musisz wiedzieć
  • Co to jest GDDR7? Wszystko, co musisz wiedzieć o pamięci VRAM nowej generacji
  • Wymiana baterii w MacBooku Pro: wszystko, co musisz wiedzieć
  • Co to jest Wi-Fi 7: wszystko, co musisz wiedzieć o standardzie 802.11be
  • YouTube wprowadza uchwyty. Oto, co musisz wiedzieć