Prihrani čas, povečaj svojo produktivnost

Vroče teme in uporabni namigi direktno v inbox.

  • May 14, 2024

OpenAI Predstavil GPT-4o in Nove Glasovne Sposobnosti

    OpenAI je pravkar predstavil GPT-4o, nov napredni multimodalni model, ki združuje obdelavo besedila, vida in zvoka ter postavlja nove standarde za zmogljivost – poleg številnih novih funkcij.

    OpenAI je pravkar predstavil GPT-4o, nov napredni multimodalni model, ki združuje obdelavo besedila, vida in zvoka ter postavlja nove standarde za zmogljivost – poleg številnih novih funkcij.

    Novi model:

    • GPT-4o zagotavlja izboljšano zmogljivost pri obdelavi besedila, računalniškega vida in zvoka, kodiranja in generiranja odgovorov v drugih jezikih, kar bistveno presega zmogljivosti GPT-4T.

    • Novi model je 50 % cenejši za uporabo, ima 5-krat višje omejitve hitrosti kot GPT-4T in se ponaša z 2-krat hitrejšo generacijo kot prejšnji modeli.

    • Razkrita je bila tudi skrivnost, da je GPT-4o tisti "im-also-a-good-gpt2-chatbot" LLM, ki je bil prejšnji teden najden v Lmsys Areni.

    Glasovne in druge nadgradnje:

    • Nove glasovne sposobnosti vključujejo odgovore v realnem času, zaznavanje in odzivanje z emocijami ter kombinacijo glasu z besedilom in vid.

    • Demonstracija je prikazala dosežke, kot so prevajanje v realnem času, analiza videa z dvema AI modeloma ter uporaba glasu in računalniškega vida za pomoč pri učenju in kodiranju.

    • Na blogu OpenAI so podrobno opisane tudi druge napredke, kot so 3D generacija, ustvarjanje pisav, velike izboljšave generiranja besedila znotraj slik, sinteza zvočnih efektov in še več.

    • OpenAI je napovedal tudi novo ChatGPT namizno aplikacijo za macOS s prenovljenim uporabniškim vmesnikom, ki se neposredno integrira v računalniške delovne tokove.

    Brezplačno za vse:

    GPT-4o, GPT modeli in funkcije, kot sta spomin in analiza podatkov, so zdaj na voljo vsem uporabnikom, kar prinaša napredne zmogljivosti tudi v brezplačno različico prvič doslej.

    Model GPT-4o je trenutno v fazi uvajanja za vse uporabnike v ChatGPT in prek API-ja, nove glasovne sposobnosti pa bodo na voljo v prihodnjih tednih.

    Zakaj je to pomembno:

    Zmožnosti glasovnih odzivov v realnem času in multimodalne sposobnosti preoblikujejo AI iz orodja v inteligenco, s katero sodelujemo, se učimo in rastemo. Poleg tega bo nova skupina brezplačnih uporabnikov (ki so morda ostali pri skromnem GPT 3.5) doživela največjo nadgradnjo v svojem življenju v obliki GPT-4o.

    Če ste zamudili, si lahko celotno predstavitev OpenAI ogledate tukaj.