SeamlessM4T няма да бъде пускан за търговска употреба
Снимка: iStock
Компанията-майка на Facebook Meta Platforms пусна модел изкуствен интелект (AI/ИИ), способен да превежда и транскрибира реч на десетки езици, потенциален градивен елемент за инструменти, позволяващи комуникация в реално време между различни езици.
Компанията съобщи в публикация в блог, че нейният модел SeamlessM4T може да поддържа преводи между текст и реч на близо 100 езика, както и пълен превод говор към говор за 35 езика, комбинирайки технология, която преди беше налична само в отделни модели.
Изпълнителният директор Марк Зукърбърг каза, че предвижда подобни инструменти да улесняват взаимодействието между потребители от цял свят в метавселената, набор от взаимосвързани виртуални светове, на които той залага бъдещето на компанията.
Meta прави модела достъпен за обществеността за некомерсиална употреба, се казва в публикацията в блога.
Най-голямата социална медийна компания в света пусна множество предимно безплатни AI модели тази година, включително голям езиков модел, наречен Llama, който представлява сериозно предизвикателство за патентованите модели, продавани от подкрепените от Microsoft OpenAI и Google на Alphabet, припомня „Ройтерс“.
Зукърбърг казва, че отворената ИИ екосистема работи в полза на Meta, тъй като компанията може да спечели повече от ефективно създаването на потребителски инструменти чрез crowd-sourcing* за своите социални платформи, отколкото от таксуване за достъп до моделите.
Независимо от това, Meta е изправена пред подобни правни въпроси като останалата част от индустрията около данните за обучение, погълнати за създаването на своите модели.
През юли комикът Сара Силвърман и двама други автори заведоха дела за нарушаване на авторски права срещу Meta и OpenAI, обвинявайки компаниите, че използват техните книги като данни за обучение без разрешение.
Изследователите на Meta съобщават в научна статия, че са събрали данни за аудио обучение на модела SeamlessM4T от 4 милиона часа „сурово аудио, произхождащо от публично достъпно хранилище на уеб данни“, без да уточняват кое хранилище.
Говорител на Meta не отговори на въпроси относно произхода на аудиоданните.
Текстовите данни идват от набори от данни, създадени миналата година, които извличат съдържание от Wikipedia и свързани уебсайтове, се казва в статията.
*практиката за получаване на информация или принос към задача или проект чрез привличане на услугите на голям брой хора, платени или неплатени, обикновено чрез интернет