Theo tờ SCMP đưa tin mới đây, chip LightGen được một nhóm nghiên cứu thuộc Đại học Giao thông Thượng Hải và Đại học Thanh Hoa phát triển, khai thác tốc độ của ánh sáng để thực thi các khối lượng công việc trí tuệ nhân tạo phức tạp.
Với hơn 2
triệu nơ-ron quang tử được tích hợp trong một chip nhỏ gọn, LightGen có thể tạo
ra hình ảnh độ phân giải cao, bao gồm các cảnh 3D và tạo video.
Nghiên cứu
do Giáo sư Chen Yitong tại Đại học Giao thông Thượng Hải đứng đầu dự kiến được
công bố trên tạp chí Science trong ngày 19/12.
Ông Chen
cho biết LightGen có thể được mở rộng hơn nữa và nói: “Chip này mang đến
cách tiếp cận mới để kết nối các kiến trúc chip mới với các ứng dụng AI phức tạp
hằng ngày mà không làm suy giảm hiệu năng, đồng thời đạt tốc độ và hiệu quả cao
hơn, hướng tới AI bền vững”.
Khi AI
phát triển nhanh chóng, AI tạo sinh hiện có thể tạo ra các hình ảnh chân thực
và thậm chí cả video, nhưng đòi hỏi năng lực tính toán lớn và tiêu thụ lượng lớn
năng lượng.
Do đó, các
nhà khoa học đã chuyển sang điện toán quang tử khi các chip điện tử truyền thống
chạm tới giới hạn.
Máy tính truyền thống dựa vào dòng electron để truyền và xử lý thông tin, trong khi điện toán quang tử sử dụng các xung laser thay cho electron, thực hiện các phép toán ở tốc độ ánh sáng. Tín hiệu quang học cũng có lợi thế là giảm thiểu tiêu thụ điện năng và phản hồi nhanh trước yêu cầu của người dùng.
Tuy nhiên,
dù các hệ thống điện toán quang tử đã cho thấy tiềm năng trong một số tác vụ cụ
thể, nhưng trước đây các hệ thống này gặp khó khăn trong xử lý các nhiệm vụ AI
tạo sinh có độ phức tạp cao, như tổng hợp hình ảnh và tạo video. Nguyên nhân là
do những hạn chế trong kiến trúc tính toán và các thuật toán huấn luyện chưa
phát triển đầy đủ.
Công trình
của nhóm chế tạo LightGen tập trung vào ba hướng: xây dựng kiến trúc mới, phát
triển thuật toán huấn luyện mới và tăng mật độ tích hợp của chip.
Về kiến
trúc, nhóm đã tạo ra một không gian tiềm ẩn quang học, tương tự một “nút giao
cao tốc” có thể mở rộng cho ánh sáng, nơi dữ liệu có thể lưu chuyển nhanh chóng
ở dạng cô đọng nhất, cho phép nén và tái tạo thông tin hiệu quả.
Các nhà
nghiên cứu cũng phát triển thuật toán huấn luyện tạo sinh mà so với các phiên bản
thông thường đã loại bỏ nhu cầu về các bộ dữ liệu gán nhãn số lượng lớn.
Thay vào
đó, họ sử dụng thuật toán huấn luyện không giám sát, cho phép LightGen học và
sáng tạo bằng cách nhận diện các mẫu thống kê trong dữ liệu, theo cách tương tự
quá trình học tập của con người.
Nhóm đã
tích hợp hơn 2 triệu nơ-ron quang tử lên một chip có diện tích 136,5 mm2, xây dựng
một mạng lưới tinh vi có khả năng xử lý tạo hình ảnh độ phân giải cao.
Các thí
nghiệm đã làm nổi bật một số năng lực của LightGen, bao gồm tạo ra hình ảnh động
vật ở độ phân giải 512x512 pixel với nhiều chủng loại, màu sắc, biểu cảm và
phông nền đa dạng, giàu chi tiết và hợp lý về mặt logic.
Nghiên cứu
cho biết: “LightGen đã triển khai thực nghiệm tạo hình ảnh độ phân giải cao,
khử nhiễu, chuyển phong cách, tạo sinh và thao tác ba chiều”.
Theo ước
tính thận trọng, hiệu năng tổng thể của LightGen vượt 100 lần các chip điện tử
hàng đầu, như chip A100 dẫn đầu thị trường của Nvidia.
Nghiên cứu
nêu rõ: “Cải thiện tốc độ tính toán và hiệu quả năng lượng của LightGen
tương ứng với mức giảm thời gian và chi phí năng lượng đầu-cuối được đo lường
thử nghiệm, khi LightGen đạt được chất lượng tạo sinh tương đương với các mô
hình AI của Nvidia A100”.
Các nhà nghiên cứu cho rằng LightGen có thể đánh dấu bước chuyển dịch đáng kể trong phần cứng phục vụ AI tạo sinh, bằng cách biến điện toán quang tử thành một nền tảng cốt lõi có khả năng độc lập thực hiện các nhiệm vụ sáng tạo phức tạp.
Họ bổ sung
rằng hiệu quả năng lượng vượt trội của LightGen cũng mở ra một lộ trình thực tế
nhằm giảm bớt nhu cầu năng lượng ngày càng tăng của hoạt động tính toán AI.
Theo BTT
