Според компанията той е по-добър от този на DeepSeek
Снимка: Alibaba
Китайската технологична компания Alibaba пусна нова версия на своя модел с изкуствен интелект Qwen 2.5, за който твърди, че надминава високо оценения DeepSeek-V3.
Необичайното време на пускане на пазара на Qwen 2.5-Max, в първия ден от Лунната нова година (29 януари), когато повечето китайци не са на работа, а са със семействата си, сочи към натиска, оказан от възхода на китайския AI стартъп DeepSeek през последните три седмици не само върху чуждестранни съперници, но и като вътрешна конкуренция, отбелязва „Ройтерс“.
„Qwen 2.5-Max превъзхожда... почти навсякъде GPT-4o, DeepSeek-V3 и Llama-3.1-405B“, съобщи облачното звено на Alibaba в WeChat, говорейки за моделите на OpenAI и най-новия с отворен код на Meta.
Пускането на 10 януари на AI асистента на DeepSeek, задвижван от модела DeepSeek-V3, както и пускането на 20 януари на модела R1, шокира Силициевата долина и предизвика спад на акциите на технологичните компании, заради предполагаемо ниските цени за разработка и ползване на китайският стартъп. Това кара инвеститорите да поставят под съмнение огромните планове за разходи на водещи фирми за изкуствен интелект в САЩ.
Но успехът на DeepSeek доведе и до битка сред местните конкуренти за надграждане на техните собствени AI модели. Два дни след пускането на DeepSeek-R1, собственикът на TikTok ByteDance пусна актуализация на своя водещ AI модел, за който твърди, че надминава поддържания от Microsoft OpenAI o1 в AIME, сравнителен тест, който измерва колко добре AI моделите разбират и реагират на сложни инструкции.
Това повтори твърдението на DeepSeek, че неговият модел R1 съперничи на o1 на OpenAI по няколко показателя за ефективност.
Предшественикът на модела V3 на DeepSeek, DeepSeek-V2, предизвика ценова война на AI модели в Китай, след като беше пуснат миналия май. Фактът, че DeepSeek-V2 беше с отворен код и безпрецедентно евтин, само 1 юан ($0,14) за 1 милион токени - или единици данни, обработени от AI модела - доведе до това облачното звено на Alibaba да обяви намаления на цените до 97% на гама от модели.
Други китайски технологични компании последваха примера, включително Baidu, която пусна първия китайски еквивалент на ChatGPT през март 2023 г., и Tencent, най-ценната интернет компания в страната.
Лианг Венфенг, енигматичният основател на DeepSeek, каза в рядко интервю за китайската медия Waves през юли, че стартъпът „не се интересува“ от ценовите войни и че постигането на AGI (изкуствен общ интелект) е основната му цел. OpenAI определя AGI като автономни системи, които превъзхождат хората в повечето икономически ценни задачи.
Докато големите китайски технологични компании като Alibaba имат стотици хиляди служители, DeepSeek работи като изследователска лаборатория, в която работят предимно млади висшисти и докторанти от водещи китайски университети.
Лианг каза в интервюто си от юли, че вярва, че най-големите технологични компании в Китай може да не са подходящи за бъдещето на AI индустрията, контрастирайки техните високи разходи и структури отгоре надолу с щадящата работа на DeepSeek и свободния стил на управление. „Големите базови модели изискват непрекъснати иновации, възможностите на технологичните гиганти имат своите граници“, каза той.