Thứ Ba, Tháng 3 17, 2026
phattrienspcongnghe.vn
  • Trang chủ
  • Crypto
  • Blockchain
  • Công nghệ
  • Kinh tế
  • Phát triển
Không có kết quả
Xem tất cả kết quả
  • Trang chủ
  • Crypto
  • Blockchain
  • Công nghệ
  • Kinh tế
  • Phát triển
Không có kết quả
Xem tất cả kết quả
phattrienspcongnghe.vn
Không có kết quả
Xem tất cả kết quả

Alibaba ra mắt các mô hình AI chuyên về toán học được cho là vượt trội hơn LLM từ OpenAI, Google

editor bởi editor
15 Tháng 8, 2024
trong Phát triển
Alibaba ra mắt các mô hình AI chuyên về toán học được cho là vượt trội hơn LLM từ OpenAI, Google

(PTCNO) – Alibaba vừa công bố một bước tiến quan trọng trong lĩnh vực AI với mô hình toán học mới, cho phép giải quyết các bài toán phức tạp một cách hiệu quả hơn. Mô hình này được kỳ vọng sẽ tạo ra những đột phá trong nhiều lĩnh vực, từnghiên cứu khoa học đến ứng dụng thực tiễn…

Các mô hình LLM dành riêng cho toán học của Alibaba đã nâng cao vị thế của công ty trong lĩnh vực AI

Để dẫn đầu trong cuộc đua phát triển trí tuệ nhân tạo, Alibaba đã cho ra mắt Qwen2-Math. Đây là một bộ các mô hình ngôn ngữ lớn được thiết kế đặc biệt để giải quyết các bài toán toán học. Alibaba tự tin cho biết Qwen2-Math có khả năng vượt qua cả GPT-4o của OpenAI, một trong những mô hình AI hàng đầu hiện nay.

Trong một bài đăng trên GitHub, nhóm Qwen thuộc đơn vị điện toán đám mây của Alibaba đã chia sẻ về quá trình nghiên cứu kéo dài một năm để cải thiện khả năng lập luận toán học của các mô hình ngôn ngữ lớn. Nhóm nghiên cứu đã tập trung vào việc nâng cao khả năng giải quyết các bài toán số học của các mô hình này.

THÀNH TÍCH VƯỢT TRỘI CỦA QWEN2 TRONG LĨNH VỰC TOÁN HỌC

Nhóm Qwen chia sẻ trong bài đăng rằng: “Trong năm qua, chúng tôi đã dành nhiều nỗ lực để nghiên cứu và nâng cao khả năng lập luận của các mô hình ngôn ngữ lớn (LLM), đặc biệt tập trung vào khả năng giải quyết các bài toán số học”.

Alibaba đã phát hành Qwen2 vào tháng 6, một hệ thống gồm nhiều mô hình AI khác nhau. Những mô hình này được thiết kế để tạo ra các văn bản giống như con người. Mỗi mô hình trong Qwen2 có một số lượng tham số khác nhau.

Tham số ở đây giống như những nút điều chỉnh nhỏ, giúp chúng ta tùy chỉnh cách mô hình hoạt động đểđạt được kết quả mong muốn. Nhờ vào các tham số này, các mô hình AI có thể thực hiện nhiều tác vụ phức tạp, từ viết văn, dịch thuật cho đến trả lời các câu hỏi phức tạp.

Theo nhóm Qwen, mô hình Qwen2-Math-72B-Instruct, với số lượng tham số lớn nhất, đã xuất sắc vượt qua các đối thủ cạnh tranh đến từ các công ty công nghệ hàng đầu Hoa Kỳ như OpenAI (GPT-4o), Anthropic (Claude 3.5 Sonnet), Google (Gemini 1.5 Pro) và Meta (Llama-3.1-405B) trong các bài kiểm tra toán học.

Mặc dù nhóm Qwen bày tỏ hy vọng rằng Qwen2-Math sẽ trở thành công cụ hữu ích để giải quyết các bài toán phức tạp, họ cũng thừa nhận rằng mô hình hiện tại chỉ hỗ trợ tiếng Anh. Tuy nhiên, nhóm đang tích cực phát triển các phiên bản song ngữ và đa ngôn ngữ để mở rộng phạm vi ứng dụng của mô hình trong tương lai.

Tongyi Qianwen, còn được gọi là Qwen, hiện bao gồm các LLM dành riêng cho toán học.

Thành tích dẫn đầu bảng xếp hạng 10 mô hình nguồn mở hàng đầu thế giớicủa Qwen-72B-Instruct LLM đã càng khẳng định vị thế hàng đầu của Alibaba trong lĩnh vực trí tuệ nhân tạo. Những mô hình toán học tiên tiến này không chỉ góp phần nâng cao uy tín của công ty mà còn chứng tỏ sự phát triển vượt bậc của AI tại Trung Quốc.

TIỀM NĂNG CỦA CÁC MÔ HÌNH NGÔN NGỮ LỚN TRUNG QUỐC

Với việc mở cửa mã nguồn Tongyi Qianwen trong hơn một năm, Alibaba đã tạo ra một cộng đồng phát triển sôi động. Các nhà phát triển trên toàn thế giới có thể tự do truy cập, sửa đổi và chia sẻ mã nguồn, từ đó tạo ra những ứng dụng và dịch vụ mới dựa trên nền tảng này. Điều này không chỉ thúc đẩy sự phát triển của AI mà còn góp phần xây dựng một hệ sinh thái công nghệ mở.

Trong bảng xếp hạng LLM của SuperClue vào tháng 7, Qwen2-72B-Instruct đã thể hiện khả năng vượt trội, chỉ xếp sau hai mô hình hàng đầu là GPT-4o và Claude 3.5 Sonnet. Điều này chứng tỏ mô hình này có khảnăng tính toán, suy luận logic, mã hóa và hiểu văn bản rất tốt.

Theo đánh giá của SuperClue, khoảng cách giữa các mô hình AI của Trung Quốc và Mỹ đang dần thu hẹp lại. Kết quả này cho thấy nỗ lực không ngừng của các nhà nghiên cứu Trung Quốc trong việc phát triển các LLM có khả năng cạnh tranh trên trường quốc tế.

Năm mô hình của Trung Quốc, bao gồm Alibaba, công ty khởi nghiệp Deepseek, SenseTime niêm yết tại Hồng Kông, nhà cung cấp điện thoại thông minh Oppo và nỗ lực hợp tác giữa Đại học Thanh Hoa và công ty khởi nghiệp Zhipu AI, đã vượt trội hơn GPT-4 Turbo – một trong những mô hình tốt nhất từ OpenAI do Microsoft hậu thuẫn, theo SuperClue.

Một bài kiểm tra riêng được công bố vào tháng 7 bởi LMSYS – một tổ chức nghiên cứu mô hình AI được hỗtrợ bởi Đại học California, Berkeley – cho thấy Qwen2-72B được xếp hạng 20, trong khi các mô hình độc quyền từ OpenAI, Anthropic và Google chiếm hầu hết các vị trí trong top 10.

Nguyễn Hà

https://vneconomy.vn/alibaba-ra-mat-cac-mo-hinh-ai-chuyen-ve-toan-hoc-duoc-cho-la-vuot-troi-hon-llm-tu-openai-google.htm

Bài trước

VCB Digibank bùng nổ với màn ra mắt giao diện YouPro chinh phục Gen Z

Bài tiếp theo

Việt Nam – ‘Thỏi nam châm’ hút ‘ông lớn’ công nghệ bán dẫn săn tìm tài năng

Bài tiếp theo
Việt Nam – ‘Thỏi nam châm’ hút ‘ông lớn’ công nghệ bán dẫn săn tìm tài năng

Việt Nam - 'Thỏi nam châm' hút 'ông lớn' công nghệ bán dẫn săn tìm tài năng

Hành trình khởi nghiệp xanh với loài hoa độc lạ của chàng trai 9x

Hành trình khởi nghiệp xanh với loài hoa độc lạ của chàng trai 9x

6 Tháng mười một, 2024
Mini Show “Lê Vân và những người bạn”: Lan toả tình yêu đất nước bằng những giai điệu cảm xúc

Mini Show “Lê Vân và những người bạn”: Lan toả tình yêu đất nước bằng những giai điệu cảm xúc

19 Tháng 8, 2025
Khung pháp lý về hoạt động cho vay ngang hàng – Bước chuyển đổi để phát triển, hạn chế rủi ro

Khung pháp lý về hoạt động cho vay ngang hàng – Bước chuyển đổi để phát triển, hạn chế rủi ro

25 Tháng 9, 2025
Truyền dữ liệu AI bằng ánh sáng – đột phá trong kết nối quang học

Truyền dữ liệu AI bằng ánh sáng – đột phá trong kết nối quang học

31 Tháng 7, 2025
Chuyên gia Đặng Quang Hồng Quân – Giám đốc kinh doanh Takumizima Việt Nam chia sẻ việcvệ sinh vòi hoa sen để loại trừ ổ vi khuẩn gây bệnh

Chuyên gia Đặng Quang Hồng Quân – Giám đốc kinh doanh Takumizima Việt Nam chia sẻ việcvệ sinh vòi hoa sen để loại trừ ổ vi khuẩn gây bệnh

18 Tháng 2, 2025
Hiệp hội AVRCIPL – Viện IMRIC và Viện IRLIE: Bàn giao nhà nhân ái – Thắm đượm tình người tại tỉnh Vĩnh Long

Hiệp hội AVRCIPL – Viện IMRIC và Viện IRLIE: Bàn giao nhà nhân ái – Thắm đượm tình người tại tỉnh Vĩnh Long

1 Tháng 2, 2026
Bệnh viện Răng Hàm Mặt Sài Gòn đồng hành cùng Giải cờ tướng tại Úc

Bệnh viện Răng Hàm Mặt Sài Gòn đồng hành cùng Giải cờ tướng tại Úc

23 Tháng 10, 2024

Doanh nghiệp Việt đang làm gì khi “sóng” AI đang phát triển mạnh mẽ?

7 Tháng 4, 2025

“Vua trái cây” nhiều lợi thế, thách thức xuất khẩu vào thị trường lớn trên thế giới

23 Tháng 9, 2024

Giá Bitcoin hôm nay ngày 26/8 giảm 2,24%

27 Tháng 8, 2024

Shopee và TikTok Shop chiếm 93,4% thị phần bán lẻ online

15 Tháng 8, 2024

Hoa hậu Calgary Doanh nhân Việt Nam Toàn cầu trao tặng 08 căn nhà tình nghĩa cho các nạn nhân dioxin tại Bắc Giang

29 Tháng 12, 2024

Bệnh viện Răng Hàm Mặt Sài Gòn trao học bổng cho học sinh nghèo hiếu học tại huyện Tân Phú (Đồng Nai)

6 Tháng 9, 2024

OpenAI ra mắt gói ChatGPT Pro dành riêng cho các nhà nghiên cứu

7 Tháng 12, 2024

Nhà sản xuất chip nhớ lớn thứ hai thế giới đạt doanh số bán hàng gấp đôi

19 Tháng 8, 2024

BÁNH MÌ ZONZON: GÓP PHẦN NÂNG TẦM TINH HOA BÁNH MÌ VIỆT VƯƠN TẦM THẾ GIỚI

16 Tháng 1, 2025
phattrienspcongnghe.vn

Bộ Khoa học và Công nghệ cấp phép số A2465 ngày 16/03/2022

ThS Mai Thanh Hải - Phó giám đốc Thường trực
Bà Nguyễn Thị Huyền - Phó giám đốc

Địa chỉ
VP chính: Số 412, đường Huỳnh Tấn Phát, phường Bình Thuận, quận 7, TP.HCM
Hà Nội: số 2 ngõ 282 Lạc Long Quân, phường Bưởi, quận Tây Hồ, Hà Nội

(Trang đang hoạt động thử nghiệm, trong khi chờ được cấp phép hoạt động )

Danh mục

  • Blockchain
  • Chưa phân loại
  • Công nghệ
  • Crypto
  • Kinh tế
  • Phát triển

Recent News

Cán bộ, giảng viên Trường Đại học Hùng Vương TP.HCM hào hứng với Hội thi nấu ăn và văn nghệ

Cán bộ, giảng viên Trường Đại học Hùng Vương TP.HCM hào hứng với Hội thi nấu ăn và văn nghệ

7 Tháng 3, 2026
Hiệp hội Nghiên cứu, tư vấn về Chính sách, pháp luật cho hoạt động đầu tư tại Việt Nam (AVRCIPL) tổ chức Hội nghị triển khai nhiệm vụ sau Tết Nguyên đán Bính Ngọ 2026

Hiệp hội Nghiên cứu, tư vấn về Chính sách, pháp luật cho hoạt động đầu tư tại Việt Nam (AVRCIPL) tổ chức Hội nghị triển khai nhiệm vụ sau Tết Nguyên đán Bính Ngọ 2026

1 Tháng 3, 2026

© 2024 phattrienspcongnghe.vn

Không có kết quả
Xem tất cả kết quả
  • Trang chủ
  • Crypto
  • Blockchain
  • Công nghệ
  • Kinh tế
  • Phát triển

© 2024 phattrienspcongnghe.vn