IklanIklanKecerdasan buatan+ IKUTIMengambil lebih banyak dengan myNEWSUMPAN berita yang dipersonalisasi dari cerita yang penting bagi AndaPelajari lebih lanjutTechTech Trends
- Model fondasi bahasa besar Hunyuan yang berusia delapan bulan mengalami peningkatan besar, yang meningkatkan kinerja keseluruhan model teks-ke-gambarnya sebesar 20 persen
- Kode sumber lengkap dari LLM teks-ke-gambarnya telah dirilis pada platform open source AS Hugging Face dan Github ‘untuk menguntungkan industri secara keseluruhan’
Kecerdasan buatan+ FOLLOWKelly Le+ FOLLOWPublished: 7:00am, 16 May 2024Mengapa Anda dapat mempercayai SCMP
Raksasa video game dan media sosial Tiongkok Tencent Holdings meluncurkan versi yang ditingkatkan dari model bahasa besar (LLM) dengan generasi teks-ke-gambar yang merupakan sumber terbuka untuk perusahaan dan individu.
Model fondasi bahasa besar Hunyuan yang berusia delapan bulan yang dikembangkan oleh Tencent mengalami peningkatan besar awal tahun ini, yang meningkatkan kinerja keseluruhan model teks-ke-gambar sebesar 20 persen dibandingkan dengan versi sebelumnya, menurut sebuah pernyataan yang diposting pada hari Selasa di akun WeChat resmi Tencent Cloud, lengan layanan komputasi awan perusahaan.
Tencent mengatakan fungsi teks-ke-gambar terbaru menggunakan arsitektur model DiT, yang juga digunakan oleh alat teks-ke-video OpenAI, Sora. Perusahaan menambahkan bahwa basis data utamanya adalah dalam bahasa Cina, memungkinkan alat untuk secara efektif dan akurat memahami perintah berbahasa Cina.
Kode sumber lengkap dari LLM teks-ke-gambarnya telah dirilis pada platform open-source AS Hugging Face dan Github “untuk menguntungkan industri secara keseluruhan dan membangun ekosistem open source untuk generasi visi generasi berikutnya”, menurut pernyataan itu.
Itu berarti baik individu maupun perusahaan dapat mengakses kode program dan memodifikasi atau membagikan desainnya, memperbaiki tautan yang rusak, atau meningkatkan kemampuannya.
Sejak meluncurkan Hunyuan September lalu, Tencent telah mengintegrasikan LLM-nya ke dalam berbagai unit bisnis perusahaan, termasuk Tencent Cloud, Tencent Games, dan aplikasi super WeChat. Perusahaan mengatakan alat bertenaga AI juga telah disediakan untuk lebih dari 20 outlet media dan perusahaan periklanan untuk memfasilitasi pekerjaan mereka.
Peluncuran versi upgrade datang sehari setelah OpenAI yang didukung Microsoft meluncurkan model GPT terbarunya, GPT-4o, yang mampu berinteraksi manusia-komputer alami di seluruh teks, gambar, video, dan audio.
Teknologi open-source telah memainkan peran penting dalam memfasilitasi kemampuan China untuk meningkatkan LLM-nya dan mengejar ketinggalan dengan alat AI generatif inovatif OpenAI.
Alibaba Group Holding, pemilik South China Morning Post, juga telah mengambil langkah agresif untuk memberikan pengembang pihak ketiga akses ke modelnya setelah raksasa e-commerce meluncurkan Tongyi Qianwen yang dikembangkan sendiri, atau Qwen, LLM tahun lalu.
Alibaba Cloud, unit komputasi awan perusahaan, telah menyediakan akses ke 76 model pembuatan teks Qwen di ModelScope dan Hugging Face.
Ini termasuk versi LLM 72 miliar parameter dan 1,8 miliar parameter. Ini juga secara bebas menyediakan model lain yang mengerti audio.
Baik Tencent dan Alibaba melaporkan laba yang lebih baik dari perkiraan pada kuartal pertama 2024.
Tencent yang berbasis di Shenhen melaporkan lonjakan 62 persen menjadi 41,9 miliar yuan (US $ 5,8 miliar) pada kuartal pertama, didorong oleh pendapatan iklan yang kuat, menandai pertumbuhan laba kuartalan pertama sejak Juni lalu.
Alibaba melaporkan peningkatan laba 10 persen menjadi 79,7 miliar yuan pada tahun keuangan hingga akhir Maret, menandai tahun paling menguntungkan sejak 2021.
Tiang