вторник, 07 май 2024   RSS
    Барометър | Региони | Компании | Лица | Назначения


    575 прочитания

    Създадоха голям езиков модел с арабски

    Jais, съдържа 13 милиарда параметъра и е с отворен код
    31 август 2023, 16:11 a+ a- a

    Снимка: iStock

    Група инженери, изследователи и базирана в Силиконовата долина компания за чипове си сътрудничиха, за да създадат усъвършенстван софтуер на арабски език, който може да захранва генеративни AI приложения, съобщи „Ройтерс“.

    Новият голям езиков модел, наречен Jais, съдържа 13 милиарда параметъра, които са направени от голяма партида данни, комбиниращи арабски и английски, част от които е и компютърен код.

    Групата, която включва учени и инженери, се зае с проекта отчасти защото казаха, че има малко големи езикови модели, които са двуезични.

    Новият езиков модел е създаден с помощта на суперкомпютри, произведени от базираната в Силиконовата долина Cerebras Systems, която проектира чипове с размер на чиния, които се конкурират с мощния AI хардуер на Nvidia. Чиповете на Nvidia са дефицитni, което накара компаниите по света да търсят алтернативи.

    Кръстен на най-високия връх в Обединените арабски емирства, Jais е сътрудничество между Cerebras, Университета за изкуствен интелект „Мохамед бин Зайед“ и дъщерно дружество на базирания в Абу Даби технологичен конгломерат G42, наречен Inception, който се фокусира върху изкуствен интелект (AI).

    Според професор Тимъти Болдуин от Университета за AI интелект „Мохамед бин Зайед“, тъй като няма достатъчно данни на арабски, за да се обучи модел с размера на Jais, компютърният код в данните на английски език помага да се обучи способността на модела да разсъждава,.

    „(Кодът) дава на модела голямо предимство по отношение на способностите за разсъждение, защото изписва (логичните) стъпки“, каза Болдуин пред „Ройтерс“.

    Jais ще бъде достъпен чрез лиценз с отворен код.

    Групата обучава модела Jais на суперкомпютър Cerebras, наречен Condor Galaxy, изграден в партньорство с G42. Тази година Cerebras обяви, че се е съгласила да построи 3 такива единици с G42, като първата е планирана да пристигне тази година, а две допълнителни единици ще бъдат доставени през 2024 г.

    „Този модел беше обучен от началото до края на 13 милиарда (параметри) за 3 дни и половина“, каза изпълнителният директор на Cerebras Андрю Фелдман. „Но имаше месеци работа преди това.“

    Нагоре
    Отпечатай
     
    * Въведеният имейл се използва само за целите на абонамента, имате възможност да прекратите абонамента по всяко време.

    02 май 2024, 16:21
    Pfizer увеличи прогнозата за печалба
    Причината – съкращения в разходите и по-добро от очакваното търсене на продукти за Covid
    02 май 2024, 13:44
    ОИСР очаква стабилен икономически ръст през 2024 и 2025 г.
    Очаква се обаче растежът да остане под дългосрочната средна стойност
    02 май 2024, 11:25
    OpenAI се споразумя с Financial Times
    Компанията за изкуствен интелект ще може да използва данни на изданието, за да обучава езиковите си модели
    02 май 2024, 09:49
    Федералният резерв остави лихвите непроменени
    Не е ясно дали американската централна банка ще успее да направи 3 намаления на лихвените проценти тази година
    02 май 2024, 08:03
    Coca-Cola ще използва облачните AI услуги на Google
    Сделката е на стойност $1,1 милиарда
    30 април 2024, 16:30
    Изследователски институт по иновативна медицина ще бъде открит в МУ-София
    Ще се провеждат проучвания на злокачествени тумори и изследвания, свързани с усложненията от Ковид-19