Descriptive Camera-konceptet trotsar tanken att en bild säger mer än tusen ord

click fraud protection
Beskrivande kamera

Konceptprylarnas värld är en konstig värld – och det är därför vi älskar den. Men då och då har denna märkliga och komplicerade plats några idéer som får oss att klia oss i huvudet. Detta Beskrivande kamera skapad av Matt Richardson gör just det.

Istället för att ta bilder och logga metadata, producerar den här kameran faktiskt den metadatan och översätter den till mänskliga beskrivningar av scenen. Om du till exempel tar en bild av en gammal stol kan resultatet bli något i stil med "Det här är en stol som ser sliten ut. Det verkar vara gammalt. Det måste fixas."

Rekommenderade videor

Nu kanske drivkraften för den här produkten inte är klar, men tekniken som driver den är verkligen anmärkningsvärd. Kameran använder Amazons Mechanical Turk API, vilket gör det möjligt för utvecklare att lägga ut denna metadata till faktiska personer (detta kallas en Human Intelligence Task) som får betalt för att läsa den och översätta den till ett språk som kan läsas av människor (intresserad? Du kan registrera dig som Mechanical Turk Worker

här). Det finns också ett alternativ som kallas "medbrottsläge" där kameran skickar ett direktmeddelande till en person med bilden och sedan får beskrivningen. Detta är snabbare och billigare men resultaten är inte riktigt lika hög kvalitet.

Som det finns för närvarande betyder det att du tar en bild, bilden skickas in för översättning och sedan väntar du. Du måste betala för tjänsten Human Intelligence Task, som kostar $1,25 varje gång och returnerar resultaten inom 3-6 minuter.

resultat

Den beskrivande kameran är ansluten till Internet via ethernet och drivs av en extern 5 voltskälla, men Richardson säger att hans långsiktiga vision är att skapa något som ser ut och fungerar som en riktig digitalkamera och är det trådlös.

Kan fortfarande inte komma längre än Varför? Det kan vi inte heller – behovet av en skriftlig beskrivning av en scen istället för bilden hänger helt enkelt inte ihop. Men användningen av Mechanical Turk API är ganska intressant och slags magi på ett sätt, och många bilder junkies skulle förmodligen hålla med om att ett mer läsvänligt format för vår metadata skulle vara ett välkommet förändra. Det skulle vara fantastiskt att se den här produkten integrerad med bilder för att skriva ut eller logga bildinformation (inklusive ISO, bländare, slutartid, etc) som är bättre skriven för människor.

För närvarande existerar det som ett koncept utan massor av verkliga tillämpningar. Som sagt, det finns onekligen något frestande med att ta bilder och få dem tolkade av någon annan. Kolla in exempel på hur den beskrivande kameran fungerar nedan.

exempel

Redaktörens rekommendationer

  • Ingenjörer bygger en ny kamera som kan ta bilder i fem dimensioner

Uppgradera din livsstilDigitala trender hjälper läsare att hålla koll på den snabba teknikvärlden med alla de senaste nyheterna, roliga produktrecensioner, insiktsfulla redaktioner och unika smygtittar.