2023 legjobb találmányai: 14-szer is szemünkbe mondja a mesterséges intelligencia, mire képes

A témát ebben részben 'Hírek!' Péter28 hozta létre. Ekkor: 2023. november 08..

  1. Péter28 / Guest

    2023 legjobb találmányai: 14-szer is szemünkbe mondja a mesterséges intelligencia, mire képes

    [​IMG]

    Nem hiányozhat a mesterséges intelligenciára alapuló megoldások hosszú sora a TIME magazin 2023 legjobb találmányait bemutató listáról. Nézzük a legizgalmasabb MI-innovációkat.

    Nincs reprezentatív kutatásunk, de valószínűleg nem túlzás azt állítani, hogy a legtöbb idei újításnak így vagy úgy, de része a mesterséges intelligencia (MI) kapcsolódik. Bár a tudósok évtizedek óta dolgoznak ezeken megoldásokon, igazán nagy lökést akkor kapott a terület, amikor az OpenAI 2022 végén bemutatta a ChatGPT-t. Ennek fényében nem túl meglepő, hogy a TIME magazin összesítésében – amelyben az év 200 legjobb innovációját szedte össze a lap –, 14 olyan fejlesztést is találunk, amit az MI hajt.

    Photoshop-megoldások
    Az Adobe jókorát okosított a Photoshopon: a a Generative Expand és a Generative Fill funkciók közül előbbi kiszélesíti a perspektívát, amelyben a kép készült – magyarul: nagyobb látószögből láthatjuk ugyanazt a témát –, míg a második kitöröl vagy hozzáad bizonyos elemeket a felvételhez. Ehhez csak be kell gépelni a megfelelő parancsot, és már meg is oldja a feladatot a rendszer, ami új korszakot nyithat a képszerkesztésben – és a képhamisításban is, de ez egy másik történt. A funkciók mögött a Firefly, az Adobe saját MI-alapú képgenerátora dolgozik.



    OpenAI GPT-4
    Az OpenAI márciusban mutatta be a GPT-4 modellt, ami azóta is az egyik legerősebb MI, ami a nyilvánosság számára is elérhető chatbotot üzemeltet. Míg az elődje, a ChatGPT csupán az ügyvédi vizsgát letevő hallgatók 10 százalékát múlta felül, a GPT-4 már a 90 százalékuknál bizonyult jobbnak. Ügyesen érvel, bonyolult fogalmakat képes egyszerűsíteni, és el tudja magyarázni, mitől vicces egy vicc.


    Runway Gen-2
    A Runway neve ismerős lehet a szemfülesebb filmrajongók számára, ez volt ugyanis az a cég, amelynek vizuális effektusait láthatjuk a Minden, mindenhol, mindenkor című Oscar-díjas filmben. A cég a nyáron mutatta be MI-modellje újabb változatát, a Gen-2-t, amely segítségével bárki képes teljes értékű videót generálni szöveges parancsokból, képekből vagy más videókból. A Runway társalapítója és vezérigazgatója, Cristóbal Valenzuela szerint a fejlesztés annyira fontos, mint a kamera volt, amikor 200 évvel ezelőtt feltalálták.


    FeaturePrint
    Az Alitheon nevű cég újdonsága, a FeaturePrint a mesterséges intelligencia segítségével, a telefon kameráján keresztül képes megállapítani, hogy egy adott termék eredeti-e, vagy hamis. A rendszer egyedi jellemzőket keres, és ha nem találja meg az összeset, amellyel az adott tárgynak mindenképp rendelkeznie kellene, akkor jelez, hogy hamisítványról van szó.

    [​IMG]
    City-Wide Drone Detection
    A fejlesztés a Dedrone nevű amerikai cég nevéhez fűződik, a lényege pedig, hogy riasztást küld a hatóságoknak, ha egy drón egy meghatározott földrajzi terület fölé merészkedik. Mindezt másodpercek alatt teszi meg, így a hatóságok szinte azonnal reagálhatnak. A cég ügyfelei között a barcelonai rendőrséget, illetve számos repteret is megtalálni.

    SeamlessM4T
    A Meta fejlesztése a vállalat eddig használt fordítóprogramját váltotta le, az új mögött pedig már a mesterséges intelligencia dolgozik. Ennek köszönhetően 100 nyelvet képes megérteni és lefordítani az algoritmus, mindezt valós időben. A Meta szerint teljesen mindegy, hogy milyen típusú fordításról van szó – szöveg-szöveg alapúról, vagy esetleg élő beszédet kell élő beszédként tolmácsolni –, az újdonság megállja a helyét. A megoldás képes egy szövegen belül több nyelvet is felismerni. Nyílt forráskódú.

    So-VITS-SVC
    A listában a TikTokon Ghostwriter néven tevékenykedő felhasználó fejlesztése is helyett kapott. Ez a mesterséges intelligencia segítségével készített egy dalt, ami úgy szól, mintha Drake és a The Weeknd közös szerzeménye lenne. Csakhogy a hangokat a mesterséges intelligencia generálta, ami olyan meggyőzőre sikerült, hogy a dal még a streamingszolgáltatóknál is fellelhető volt – amíg rá nem jöttek a csalásra.


    AlertCalifornia és Cal Fire
    Az elmúlt években egyre súlyosabb problémát jelentenek az Egyesült Államokban – főként Kaliforniában – az erdőtüzek. A Kaliforniai Egyetem tudósai ezért egy olyan mesterséges intelligenciát fejlesztettek ki, amely detektálja és azonnal jelzi a hatóságoknak, ha valahol tűz ütne ki. Az algoritmus egy kamerahálózat képeit elemzi valós időben. A rendszer már éles helyzetben is vizsgázott, segítségével 45 perc alatt sikerült megfékezni a felcsapó lángokat.

    [​IMG]
    Stable Audio
    A Stability AI által létrehozott generatív mesterséges intelligencia, a Stable Audio egy olyan zenekészítő algoritmus, ami képes néhány beírt utasítás alapján bármilyen hangot vagy dalt legenerálni. A rendszert egy olyan weboldalon képezték ki, ami több mint 800 000 hangfájlt tartalmaz. A végeredményt bárki letöltheti és szabadon felhasználhatja, annyi megkötéssel, hogy a forrást meg kell jelölni.


    TrailGuard AI
    Az orvvadászattal veszi fel a küzdelmet az amerikai Resolve fejlesztése, a TrailGuard AI. A cég egy olyan kütyüt készített, ami a kamerái segítségével érzékeli, ha egy ember közelít egy veszélyeztetett állat felé. A kütyü 30 másodperc alatt képes továbbítani a képet a hatóságoknak, így azok gyorsan tudnak reagálni a történésekre. A segítségével eddig 30 orvvadászt tartóztattak le Afrikában és Indiában.

    Dall-E 3
    Az OpenAI az idei évben tette elérhetővé a képgeneráló mesterséges intelligencia, a Dall-E legújabb változatát, a Dall-E 3-at. Az újdonság az elődökkel ellentétben már érti a természetes nyelvet, így úgy adhatunk neki információt, mint a ChatGPT-nek.


    Project Gutenberg Open Audiobook Collection
    Még az 1970-es években indult el a Project Gutenberg nevű kezdeményezés, melynek lényege, hogy az e-könyvek hozzáférhetők legyenek. A Microsoft és a Massachusettsi Műszaki Egyetem nemrég összefogott, és egy olyan mesterséges intelligenciát készített, ami 5000 ingyenesen elérhető könyvből csinált narrált hangoskönyvet. A gyűjtemény már elérhető a Spotify-on.


    AudioShake
    Maradva a hangokkal foglalkozó mesterséges intelligenciánál, a Time az AudioShake-et is beválogatta az idei év legjobb MI-fejlesztései közé. A szoftver képes arra, hogy a hangsávokból összeállított dalt újra elemeire bontsa, így úgy vehető ki például a gitár a zenéből, hogy semmilyen más hangszer nem hallatszódik közben.


    Humane AI Pin
    Igen izgalmas elképzeléssel állt elő nemrég a Humane nevű amerikai cég. Az Apple két volt alkalmazottja által életre hívott vállalat olyan eszközt fejleszt, amely az alapítók reménye az okostelefonokkal is leszámolhat: kijelzője nincs, ehelyett az ember kezére vetíti az információkat.

    [​IMG]
    Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

    2023. november. 02. 10:03 Tech

    https://hvg.hu/tudomany/20231102_ti...sta_photoshop_gpt_4_runway_gen_2_featureprint

    A videók a linkre kattintva érhetőek el.