"AI là cung tên của thời đại đồ đá mới." Khả năng học tập được hình thành bởi AI phụ thuộc vào quy mô của các tham số. GPT-2 có khoảng 1,5 tỷ tham số, trong khi mẫu GPT-3 lớn nhất có 175 tỷ tham số, tăng gấp hai bậc. Theo đồn đoán của giới truyền thông nhưng tin tức chưa được xác nhận thì thông số của GPT-4 có thể lên tới 100 nghìn tỷ.
Bài viết chủ yếu thảo luận về: khả năng và cách xây dựng, cơ hội và thách thức của nền tảng AI tương tác trong thời đại mới. Khác với một số quan điểm truyền thống cho rằng việc xây dựng trí tuệ nhân tạo chủ yếu là xây dựng phần cứng, Yang Jihong, Phó giám đốc Trung tâm Truyền thông Nghe nhìn Mới của Đài Phát thanh và Truyền hình Trung ương Trung Quốc, bắt đầu từ góc độ “con người” và nhấn mạnh rằng “con người”, tức là người dùng là người quyết định cuộc chiến trí tuệ nhân tạo, nguồn lực chiến lược trong chiến dịch. Bà cho rằng “công nghệ mềm” là “đường vàng” để vượt các góc cua, chuyển làn để đổi mới khoa học công nghệ. Nắm chắc “kịch bản sử dụng của người dùng” là “người chiến thắng”.
Thảo luận ngắn gọn về sức mạnh cứng và sức mạnh mềm của nền tảng AI tương tác
##01 Lời nói đầu Hằng số duy nhất là sự thay đổi
Sự đổi mới không bao giờ dừng lại, các công nghệ mới liên tục xuất hiện và sự đổi mới công nghệ do AI thúc đẩy đang thay đổi sâu sắc cách chúng ta sống và làm việc.
Nếu sự phổ biến của máy tính, mạng, Internet là làn sóng thay đổi do máy tính mang lại thì sức mạnh áp đảo của AI còn mạnh mẽ và toàn diện hơn. Các ngành, nghề truyền thống đang bị tác động và phá hủy bởi công nghệ trí tuệ nhân tạo, nhiều công việc truyền thống bị thay thế, cần liên tục học hỏi, thích ứng với các công nghệ mới, mô hình mới.
Khi có AI trong bài viết này, tôi cố gắng đề xuất một góc nhìn mới để cùng các bạn xem xét khả năng và cách xây dựng, cơ hội và thách thức của nền tảng AI tương tác trong kỷ nguyên mới. Khác với một số quan điểm truyền thống cho rằng xây dựng trí tuệ nhân tạo chủ yếu là xây dựng phần cứng, tôi cố gắng sử dụng quyền lực cứng và quyền lực mềm để giải cấu trúc những năng lực trí tuệ nhân tạo luôn thay đổi từ một chiều hướng cao hơn, bắt đầu từ góc độ “con người”, nhấn mạnh vào “con người”. Nói cách khác, người dùng là nguồn lực chiến lược trong trận chiến quyết định chống lại trí tuệ nhân tạo.
##02“Quyền lực cứng” và “quyền lực mềm” của nền tảng AI tương tác
1. Sức mạnh cứng trong AI tương tác
1.1 Phần cứng máy tính được biểu thị bằng CPU/GPU
Phần cứng máy tính là nền tảng của AI. Đầu tiên, phần cứng máy tính trực tiếp xác định khả năng xử lý các tác vụ tính toán phức tạp của AI. Việc xử lý lượng lớn dữ liệu, tính toán, huấn luyện các thuật toán deep learning... đòi hỏi phải có đủ sức mạnh tính toán, hiệu năng của CPU/GPU quyết định trực tiếp đến tốc độ và hiệu quả tính toán của AI. Thứ hai, là một thiết bị phần cứng, CPU/GPU cần hỗ trợ môi trường vận hành phần mềm AI. AI liên quan đến một số lượng lớn các tác vụ tính toán và xử lý dữ liệu, đồng thời yêu cầu một môi trường phần mềm đặc biệt để hỗ trợ hoạt động của nó. Ngoài ra, phần cứng máy tính cũng cần có khả năng mở rộng và lập trình cao. Có rất nhiều kịch bản ứng dụng AI và các giải pháp AI khác nhau cần được cung cấp cho các kịch bản và ứng dụng khác nhau. Việc phân bổ động và mở rộng tài nguyên chỉ có thể được thực hiện nhanh chóng nếu phần cứng máy tính có khả năng mở rộng cao. Cuối cùng, phần cứng máy tính cũng cần phải có khả năng lập trình để các nhà phát triển có thể nhanh chóng tối ưu hóa các thuật toán và giải pháp. Hình dưới đây cho thấy thành phần phần cứng cơ bản và các chức năng của nền tảng hệ thống AI:
2. “Quyền lực mềm” là nền tảng của AI tương tác
2.1 Sơ đồ tri thức định hình thị trường cơ bản của AI
Biểu đồ tri thức AI là một cơ sở tri thức có cấu trúc chứa nhiều miền tri thức và được sử dụng để hỗ trợ việc học và suy luận của hệ thống trí tuệ nhân tạo. Sơ đồ tri thức bao gồm các thực thể (chẳng hạn như con người, địa điểm, sự kiện, v.v.) và mối quan hệ giữa chúng. Nó có thể bao gồm nhiều loại kiến thức khác nhau, bao gồm định nghĩa, thuộc tính, danh mục, liên kết, v.v.
Việc xây dựng và sử dụng đồ thị tri thức là một phần quan trọng của công nghệ AI. Nó có thể giúp các hệ thống AI thu thập, sắp xếp và lưu trữ kiến thức cũng như thông tin ngữ nghĩa trong các lĩnh vực khác nhau, đồng thời cải thiện khả năng nhận thức và trí thông minh của hệ thống AI. Sơ đồ tri thức có thể được sử dụng trong nhiều khía cạnh như xử lý ngôn ngữ tự nhiên, hệ thống khuyến nghị, hệ thống hỏi đáp và truy xuất thông tin.
Để đưa ra một số ví dụ quen thuộc, Sơ đồ tri thức của Google, Bách khoa toàn thư Baidu và Wikipedia đều là các biểu đồ tri thức.
Nâng cấp năng lực điều khiển cấp độ thuật toán 2.2
2.2.1 Tầm quan trọng của thuật toán
Thuật toán là một phương tiện quan trọng để đạt được các nhiệm vụ AI khác nhau. Việc thiết kế và cải tiến các thuật toán cũng là chìa khóa thúc đẩy sự phát triển và tiến bộ của AI. Tầm quan trọng của thuật toán được phản ánh ở ba khía cạnh sau:
① Ảnh hưởng đến độ chính xác và hiệu quả của mô hình: Các thuật toán khác nhau sẽ ảnh hưởng đến độ chính xác và hiệu quả tính toán của mô hình. Việc chọn thuật toán thích hợp có thể cải thiện độ chính xác của mô hình và giảm thời gian tính toán.
② Đáp ứng các nhu cầu và kịch bản khác nhau: Các kịch bản và ứng dụng khác nhau có nhu cầu khác nhau và cần phải chọn các thuật toán khác nhau để đáp ứng chúng.
③ Cung cấp hỗ trợ quyết định: Theo các vấn đề và dữ liệu khác nhau, thuật toán có thể cung cấp hỗ trợ quyết định, đồng thời phân tích và dự đoán dữ liệu một cách hiệu quả.
2.2.2 Các thuật toán phổ biến
Có nhiều thuật toán được sử dụng trong AI để thích ứng với các tình huống và nhu cầu ứng dụng khác nhau. Có bốn loại phổ biến: thuật toán học máy, thuật toán học sâu, thuật toán xử lý ngôn ngữ tự nhiên và thuật toán đề xuất.
① Thuật toán học máy:
(1) Các thuật toán học có giám sát: như hồi quy tuyến tính, hồi quy logistic, máy vectơ hỗ trợ, cây quyết định, rừng ngẫu nhiên, v.v.
(2) Các thuật toán học không giám sát: như phân cụm K-Means, phân cụm theo cấp bậc, thuật toán Tối đa hóa Kỳ vọng, v.v.
② Thuật toán học sâu:
(1) Mạng thần kinh chuyển đổi (CNN): Chủ yếu được sử dụng trong các tác vụ xử lý hình ảnh và thị giác máy tính.
(2) Mạng thần kinh tái phát (RNN): Chủ yếu được sử dụng trong các tác vụ tuần tự hóa như xử lý ngôn ngữ tự nhiên và xử lý giọng nói.
(3) Mạng đối đầu sáng tạo (GAN): Nó chủ yếu được sử dụng trong các tác vụ như tạo hình ảnh và văn bản.
(4) Mạng biến áp (Transformer): Chủ yếu được sử dụng trong các công việc như dịch máy và tóm tắt văn bản.
③ Thuật toán xử lý ngôn ngữ tự nhiên:
(1) Trích xuất từ khóa: như thuật toán TF-IDF, thuật toán TextRank, v.v.
(2) Nhận dạng thực thể được đặt tên: chẳng hạn như mô hình trường ngẫu nhiên có điều kiện, v.v.
(3) Các thuật toán phân tích cú pháp: như mô hình quy tắc, mô hình chuyển giao, v.v.
(4) Các thuật toán phân tích cảm xúc: như mô hình từ điển, mô hình học máy, v.v.
④ Thuật toán đề xuất:
(1) Đề xuất dựa trên nội dung: chẳng hạn như thuật toán TF-IDF, thuật toán LDA, v.v.
(2) Đề xuất dựa trên lọc cộng tác: chẳng hạn như thuật toán UserCF, ItemCF, LFM, v.v.
(3) Đề xuất học sâu: chẳng hạn như DeepFM, Wide&Deep, DIN, BERT4Rec, v.v.
Thuật toán là nền tảng của trí tuệ nhân tạo để đạt được nhiều nhiệm vụ khác nhau. Khi công nghệ tiếp tục phát triển và đổi mới, các thuật toán AI mới không ngừng xuất hiện. Chìa khóa để cải thiện khả năng của AI là chọn và kết hợp thuật toán phù hợp với tình huống phù hợp. Từ quan điểm này, chìa khóa của trí tuệ nhân tạo vẫn nằm ở thiết kế của con người.
2.3 Các kịch bản huấn luyện ảnh hưởng đến tốc độ tiến hóa
2.3.1 Tầm quan trọng của đào tạo
Đào tạo là quá trình mà mô hình AI học hỏi và tiếp thu kiến thức cũng như kỹ năng, do đó rất quan trọng đối với trí tuệ nhân tạo.
① Cải thiện độ chính xác của mô hình: Thông qua việc lựa chọn tập dữ liệu hợp lý và thời gian đào tạo đủ, mô hình AI có thể dần dần tìm hiểu các quy luật và đặc điểm trong dữ liệu, từ đó cải thiện độ chính xác và chính xác của mô hình.
② Hỗ trợ khả năng khái quát hóa của mô hình: Việc huấn luyện giúp mô hình có khả năng khái quát hóa, nghĩa là nó có thể xử lý các mẫu dữ liệu mới ngoài tập huấn luyện và đóng vai trò trong các tình huống khác.
③ Cải thiện độ tin cậy của mô hình: Việc đào tạo có thể làm cho mô hình AI có khả năng xử lý tốt hơn và độ bền cao hơn đối với một số dữ liệu nhiễu, dữ liệu giả mạo và dữ liệu bị nhiễu.
④ Cập nhật và lặp lại mô hình AI: Thông qua đào tạo, mô hình AI có thể được cập nhật và cải tiến liên tục để đáp ứng nhu cầu ứng dụng thực tế.
⑤ Cải thiện khả năng diễn giải mô hình: Khả năng diễn giải của mô hình dữ liệu AI rất quan trọng trong nhiều lĩnh vực. Thông qua đào tạo, khả năng diễn giải và tính minh bạch của mô hình có thể được cải thiện, giúp dễ hiểu và sử dụng hơn.
2.3.2 Các kịch bản huấn luyện ảnh hưởng đến tốc độ tiến hóa
Việc thiết lập và lựa chọn các kịch bản đào tạo có ý nghĩa quan trọng đối với hiệu suất và hiệu suất của mô hình AI, điều này quyết định trực tiếp đến chất lượng và khả năng sử dụng của mô hình. Trong quá trình đào tạo, cần xử lý trước dữ liệu, chọn thuật toán phù hợp, tối ưu hóa siêu tham số thuật toán, kiểm soát mức độ phù hợp và quá mức, v.v. để làm cho kết quả đào tạo mô hình AI chính xác và đáng tin cậy hơn. Những nhiệm vụ quan trọng nhất này về cơ bản dựa vào sự tham gia thủ công, điều này cũng phản ánh vị thế của “con người” là nguồn lực chiến lược cốt lõi.
① Kịch bản học có giám sát: Bằng cách cung cấp tập dữ liệu được gắn nhãn cho mô hình, cho biết dữ liệu thuộc về danh mục hoặc giá trị mục tiêu nào, v.v.
② Kịch bản học không giám sát: Tập dữ liệu huấn luyện không có nhãn hoặc giá trị đích cụ thể, mô hình cần tự khám phá các quy luật và đặc điểm của dữ liệu theo đặc điểm thống kê của tập dữ liệu để xử lý và phân loại dữ liệu.
③ Kịch bản học bán giám sát: Chứa dữ liệu được gắn nhãn và không được gắn nhãn, đồng thời mô hình cần học cách phân loại các dữ liệu không được gắn nhãn này.
④ Kịch bản học tăng cường: Mô hình liên tục tương tác với môi trường, quan sát và tương tác với môi trường tại mọi thời điểm, đồng thời điều chỉnh chiến lược của mô hình dựa trên thông tin phản hồi.
⑤ Kịch bản xử lý ngôn ngữ tự nhiên: Tập dữ liệu huấn luyện nói chung là một lượng lớn dữ liệu văn bản và mô hình cần học cách hiểu dữ liệu văn bản và mối quan hệ giữa các văn bản.
⑥ Kịch bản thị giác máy tính: Tập dữ liệu huấn luyện thường là dữ liệu hình ảnh hoặc video và mô hình cần học cách hiểu và xử lý những dữ liệu hình ảnh này để đạt được các nhiệm vụ như phát hiện mục tiêu và nhận dạng hình ảnh.
03 "Các kịch bản sử dụng của người dùng" là những nguồn lực chiến lược tổng thể rất khan hiếm.
Người dùng hạn chế, dữ liệu không giới hạn
Hiện tại, có những hạn chế và hạn chế nhất định nhằm nâng cao độ chính xác và mức độ thông minh của các sản phẩm trí tuệ nhân tạo bằng cách mở rộng phần cứng máy tính và mở rộng cơ sở dữ liệu. Một mặt, việc mở rộng phần cứng máy tính và mở rộng cơ sở dữ liệu đòi hỏi sự đầu tư lớn về nhân lực, tài chính và thời gian, khi quy mô của hệ thống tiếp tục mở rộng thì nhu cầu về tài nguyên sẽ tăng lên. Mặt khác, sự phát triển công nghệ trong lĩnh vực trí tuệ nhân tạo hiện nay vẫn phải đối mặt với nhiều yếu tố chưa chắc chắn, như hiệu quả của thuật toán và hiệu quả của việc tự học. Những yếu tố này sẽ ảnh hưởng đến không gian phát triển của các sản phẩm trí tuệ nhân tạo.
So với dữ liệu không giới hạn, cuộc cạnh tranh về tài nguyên người dùng là một trò chơi có tổng bằng 0. Nếu một sản phẩm trí tuệ nhân tạo có số lượng người dùng lớn và được sử dụng thường xuyên, nó có thể nhận ra sự nâng cấp thông minh của sản phẩm trí tuệ nhân tạo thông qua việc giám sát và phân tích dữ liệu sử dụng của người dùng, liên tục cải tiến hệ thống sản phẩm và tăng giá trị sử dụng.
Nhiều người dùng hơn tạo ra một nền tảng tiên tiến hơn; một nền tảng tiên tiến hơn tạo ra trải nghiệm tốt hơn; trải nghiệm tốt hơn sẽ thu hút nhiều người dùng hơn.
Sự khác biệt về khả năng của các nền tảng AI theo các hệ tư tưởng khác nhau trong tương lai về cơ bản được xác định bởi sự khác biệt về số lượng người dùng và tần suất sử dụng. Để có được nhiều người dùng hơn và sử dụng thường xuyên, cần liên tục cải tiến và tối ưu hóa giao diện người dùng, chức năng, chất lượng dịch vụ, quảng bá thị trường, v.v., liên tục đáp ứng nhu cầu của người dùng và cải thiện trải nghiệm người dùng, đồng thời chiếm được lòng tin và lòng trung thành của người dùng.
“Hiệu ứng Matthew” ăn thịt người
Hiệu ứng Matthew đề cập đến hiện tượng trong những điều kiện nhất định, những tài năng xuất chúng liên tục được hỗ trợ, dẫn đến khoảng cách giữa các tài năng ngày càng lớn.
Trong quá trình phát triển trí tuệ nhân tạo, các công nghệ tiên tiến hoặc các công ty tiên tiến thường dễ dàng có được nhóm người dùng và thị phần đầu tiên hơn, dẫn đến đầu tư nhiều hơn và lợi nhuận tốt hơn. Hiện tượng này sẽ củng cố hơn nữa vị trí dẫn đầu của ngành.
Mặt khác, việc phát triển công nghệ AI cũng đòi hỏi một lượng lớn nhân tài có chuyên môn. Các công ty và nền tảng hàng đầu có đủ nguồn lực để tiếp tục đầu tư thêm kinh phí và nguồn lực nhằm đạt được lợi thế về nhân tài, khiến những người đi sau hoàn toàn mất khả năng bắt kịp.
Điều quan trọng nhất là nền tảng hàng đầu sẽ mang lại trải nghiệm người dùng tốt hơn. Hiện tại, hiệu ứng Matthew trong thị trường AI đến C đã được nêu bật. Từ góc độ tâm lý người dùng, người dùng đã quen với việc sử dụng một loại sản phẩm AI cần phải tìm hiểu lại và thích nghi khi chuyển sang sản phẩm khác cùng loại, đòi hỏi nhiều thời gian và công sức. Từ góc độ quy mô dữ liệu, việc tích lũy một lượng lớn dữ liệu người dùng có ý nghĩa rất lớn đối với hiệu quả sử dụng và phân tích sản phẩm. Việc giữ lại dữ liệu người dùng là chìa khóa để thiết lập các sản phẩm đó. Sản phẩm mới có những nhược điểm cố hữu. “Hiệu ứng bánh đà” tự nhiên của hệ thống AI càng khuếch đại hơn nữa việc thể hiện “Hiệu ứng Matthew” trong trải nghiệm người dùng.
##04 Kết luận
Một câu nói thú vị: AI là cung tên của thời kỳ đồ đá mới.
Khả năng học tập được hình thành bởi AI phụ thuộc vào quy mô của các tham số. Theo kinh nghiệm học thuật, khả năng học của mạng lưới thần kinh sâu có mối tương quan thuận với thang đo tham số của mô hình, tức là mô hình càng nhiều tham số thì khả năng học càng mạnh. GPT-2 có khoảng 1,5 tỷ tham số, trong khi mẫu GPT-3 lớn nhất có 175 tỷ tham số, tăng gấp hai bậc. Theo đồn đoán của giới truyền thông nhưng tin tức chưa được xác nhận thì thông số của GPT-4 có thể lên tới 100 nghìn tỷ.
Một số chuyên gia trong ngành tin rằng công nghệ cứng cung cấp các thành phần chính và giao diện phần cứng để phát triển "công nghệ mềm" và đổi mới theo nhu cầu của chuỗi cung ứng "công nghệ mềm". “Công nghệ mềm” là “đường vàng” vượt trên những khúc cua, chuyển làn để đổi mới công nghệ.
CCTV đã tìm ra một sự kết hợp hiệu quả: đầu tiên, nó tinh chỉnh nhu cầu của người dùng thành một loạt các hướng trao quyền cho AI như hỗ trợ y tế, hỗ trợ nông nghiệp, hỗ trợ làm đẹp và hỗ trợ sinh viên, sau đó nâng tầm tổng thể thông qua kết hợp ngữ nghĩa tìm kiếm mờ. tài nguyên xây dựng các mô hình sử dụng tần số cao trong các tình huống ứng dụng khác nhau, hình thành khả năng tự học về "sức mạnh mềm" như cơ sở kiến thức và thuật toán, buộc phải xây dựng sức mạnh cứng như sức mạnh tính toán GPU và băng thông CDN. Nắm chắc “kịch bản sử dụng của người dùng” là “người chiến thắng”.
Điều thú vị là định hướng kỹ thuật của GPT hiện đã rõ ràng và không có trở ngại kỹ thuật nào không thể vượt qua. Chúng ta có thể vận dụng tinh thần “trường tồn” mà người Trung Quốc giỏi nhất để bắn cung tên “Thời đại đồ đá mới” này một cách chính xác và xa nhất.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Ý kiến | “Kịch bản sử dụng của người dùng” là chìa khóa phát triển nền tảng AI
Bản gốc: Yang Jihong
**Nguồn: **AI Dark Horse
Giới thiệu về AI Dark Horse 👉
"AI là cung tên của thời đại đồ đá mới." Khả năng học tập được hình thành bởi AI phụ thuộc vào quy mô của các tham số. GPT-2 có khoảng 1,5 tỷ tham số, trong khi mẫu GPT-3 lớn nhất có 175 tỷ tham số, tăng gấp hai bậc. Theo đồn đoán của giới truyền thông nhưng tin tức chưa được xác nhận thì thông số của GPT-4 có thể lên tới 100 nghìn tỷ.
Bài viết chủ yếu thảo luận về: khả năng và cách xây dựng, cơ hội và thách thức của nền tảng AI tương tác trong thời đại mới. Khác với một số quan điểm truyền thống cho rằng việc xây dựng trí tuệ nhân tạo chủ yếu là xây dựng phần cứng, Yang Jihong, Phó giám đốc Trung tâm Truyền thông Nghe nhìn Mới của Đài Phát thanh và Truyền hình Trung ương Trung Quốc, bắt đầu từ góc độ “con người” và nhấn mạnh rằng “con người”, tức là người dùng là người quyết định cuộc chiến trí tuệ nhân tạo, nguồn lực chiến lược trong chiến dịch. Bà cho rằng “công nghệ mềm” là “đường vàng” để vượt các góc cua, chuyển làn để đổi mới khoa học công nghệ. Nắm chắc “kịch bản sử dụng của người dùng” là “người chiến thắng”.
Thảo luận ngắn gọn về sức mạnh cứng và sức mạnh mềm của nền tảng AI tương tác
##01 Lời nói đầu Hằng số duy nhất là sự thay đổi
Sự đổi mới không bao giờ dừng lại, các công nghệ mới liên tục xuất hiện và sự đổi mới công nghệ do AI thúc đẩy đang thay đổi sâu sắc cách chúng ta sống và làm việc.
Nếu sự phổ biến của máy tính, mạng, Internet là làn sóng thay đổi do máy tính mang lại thì sức mạnh áp đảo của AI còn mạnh mẽ và toàn diện hơn. Các ngành, nghề truyền thống đang bị tác động và phá hủy bởi công nghệ trí tuệ nhân tạo, nhiều công việc truyền thống bị thay thế, cần liên tục học hỏi, thích ứng với các công nghệ mới, mô hình mới.
Khi có AI trong bài viết này, tôi cố gắng đề xuất một góc nhìn mới để cùng các bạn xem xét khả năng và cách xây dựng, cơ hội và thách thức của nền tảng AI tương tác trong kỷ nguyên mới. Khác với một số quan điểm truyền thống cho rằng xây dựng trí tuệ nhân tạo chủ yếu là xây dựng phần cứng, tôi cố gắng sử dụng quyền lực cứng và quyền lực mềm để giải cấu trúc những năng lực trí tuệ nhân tạo luôn thay đổi từ một chiều hướng cao hơn, bắt đầu từ góc độ “con người”, nhấn mạnh vào “con người”. Nói cách khác, người dùng là nguồn lực chiến lược trong trận chiến quyết định chống lại trí tuệ nhân tạo.
##02“Quyền lực cứng” và “quyền lực mềm” của nền tảng AI tương tác
1. Sức mạnh cứng trong AI tương tác
1.1 Phần cứng máy tính được biểu thị bằng CPU/GPU
Phần cứng máy tính là nền tảng của AI. Đầu tiên, phần cứng máy tính trực tiếp xác định khả năng xử lý các tác vụ tính toán phức tạp của AI. Việc xử lý lượng lớn dữ liệu, tính toán, huấn luyện các thuật toán deep learning... đòi hỏi phải có đủ sức mạnh tính toán, hiệu năng của CPU/GPU quyết định trực tiếp đến tốc độ và hiệu quả tính toán của AI. Thứ hai, là một thiết bị phần cứng, CPU/GPU cần hỗ trợ môi trường vận hành phần mềm AI. AI liên quan đến một số lượng lớn các tác vụ tính toán và xử lý dữ liệu, đồng thời yêu cầu một môi trường phần mềm đặc biệt để hỗ trợ hoạt động của nó. Ngoài ra, phần cứng máy tính cũng cần có khả năng mở rộng và lập trình cao. Có rất nhiều kịch bản ứng dụng AI và các giải pháp AI khác nhau cần được cung cấp cho các kịch bản và ứng dụng khác nhau. Việc phân bổ động và mở rộng tài nguyên chỉ có thể được thực hiện nhanh chóng nếu phần cứng máy tính có khả năng mở rộng cao. Cuối cùng, phần cứng máy tính cũng cần phải có khả năng lập trình để các nhà phát triển có thể nhanh chóng tối ưu hóa các thuật toán và giải pháp. Hình dưới đây cho thấy thành phần phần cứng cơ bản và các chức năng của nền tảng hệ thống AI:
2.1 Sơ đồ tri thức định hình thị trường cơ bản của AI
Biểu đồ tri thức AI là một cơ sở tri thức có cấu trúc chứa nhiều miền tri thức và được sử dụng để hỗ trợ việc học và suy luận của hệ thống trí tuệ nhân tạo. Sơ đồ tri thức bao gồm các thực thể (chẳng hạn như con người, địa điểm, sự kiện, v.v.) và mối quan hệ giữa chúng. Nó có thể bao gồm nhiều loại kiến thức khác nhau, bao gồm định nghĩa, thuộc tính, danh mục, liên kết, v.v.
Để đưa ra một số ví dụ quen thuộc, Sơ đồ tri thức của Google, Bách khoa toàn thư Baidu và Wikipedia đều là các biểu đồ tri thức.
Nâng cấp năng lực điều khiển cấp độ thuật toán 2.2
2.2.1 Tầm quan trọng của thuật toán
Thuật toán là một phương tiện quan trọng để đạt được các nhiệm vụ AI khác nhau. Việc thiết kế và cải tiến các thuật toán cũng là chìa khóa thúc đẩy sự phát triển và tiến bộ của AI. Tầm quan trọng của thuật toán được phản ánh ở ba khía cạnh sau:
① Ảnh hưởng đến độ chính xác và hiệu quả của mô hình: Các thuật toán khác nhau sẽ ảnh hưởng đến độ chính xác và hiệu quả tính toán của mô hình. Việc chọn thuật toán thích hợp có thể cải thiện độ chính xác của mô hình và giảm thời gian tính toán.
② Đáp ứng các nhu cầu và kịch bản khác nhau: Các kịch bản và ứng dụng khác nhau có nhu cầu khác nhau và cần phải chọn các thuật toán khác nhau để đáp ứng chúng.
③ Cung cấp hỗ trợ quyết định: Theo các vấn đề và dữ liệu khác nhau, thuật toán có thể cung cấp hỗ trợ quyết định, đồng thời phân tích và dự đoán dữ liệu một cách hiệu quả.
2.2.2 Các thuật toán phổ biến
Có nhiều thuật toán được sử dụng trong AI để thích ứng với các tình huống và nhu cầu ứng dụng khác nhau. Có bốn loại phổ biến: thuật toán học máy, thuật toán học sâu, thuật toán xử lý ngôn ngữ tự nhiên và thuật toán đề xuất.
(1) Các thuật toán học có giám sát: như hồi quy tuyến tính, hồi quy logistic, máy vectơ hỗ trợ, cây quyết định, rừng ngẫu nhiên, v.v.
(2) Các thuật toán học không giám sát: như phân cụm K-Means, phân cụm theo cấp bậc, thuật toán Tối đa hóa Kỳ vọng, v.v.
② Thuật toán học sâu:
(1) Mạng thần kinh chuyển đổi (CNN): Chủ yếu được sử dụng trong các tác vụ xử lý hình ảnh và thị giác máy tính.
(2) Mạng thần kinh tái phát (RNN): Chủ yếu được sử dụng trong các tác vụ tuần tự hóa như xử lý ngôn ngữ tự nhiên và xử lý giọng nói.
(3) Mạng đối đầu sáng tạo (GAN): Nó chủ yếu được sử dụng trong các tác vụ như tạo hình ảnh và văn bản.
(4) Mạng biến áp (Transformer): Chủ yếu được sử dụng trong các công việc như dịch máy và tóm tắt văn bản.
③ Thuật toán xử lý ngôn ngữ tự nhiên:
(1) Trích xuất từ khóa: như thuật toán TF-IDF, thuật toán TextRank, v.v.
(2) Nhận dạng thực thể được đặt tên: chẳng hạn như mô hình trường ngẫu nhiên có điều kiện, v.v.
(3) Các thuật toán phân tích cú pháp: như mô hình quy tắc, mô hình chuyển giao, v.v.
(4) Các thuật toán phân tích cảm xúc: như mô hình từ điển, mô hình học máy, v.v.
④ Thuật toán đề xuất:
(1) Đề xuất dựa trên nội dung: chẳng hạn như thuật toán TF-IDF, thuật toán LDA, v.v.
(2) Đề xuất dựa trên lọc cộng tác: chẳng hạn như thuật toán UserCF, ItemCF, LFM, v.v.
(3) Đề xuất học sâu: chẳng hạn như DeepFM, Wide&Deep, DIN, BERT4Rec, v.v.
Thuật toán là nền tảng của trí tuệ nhân tạo để đạt được nhiều nhiệm vụ khác nhau. Khi công nghệ tiếp tục phát triển và đổi mới, các thuật toán AI mới không ngừng xuất hiện. Chìa khóa để cải thiện khả năng của AI là chọn và kết hợp thuật toán phù hợp với tình huống phù hợp. Từ quan điểm này, chìa khóa của trí tuệ nhân tạo vẫn nằm ở thiết kế của con người.
2.3 Các kịch bản huấn luyện ảnh hưởng đến tốc độ tiến hóa
2.3.1 Tầm quan trọng của đào tạo
Đào tạo là quá trình mà mô hình AI học hỏi và tiếp thu kiến thức cũng như kỹ năng, do đó rất quan trọng đối với trí tuệ nhân tạo.
① Cải thiện độ chính xác của mô hình: Thông qua việc lựa chọn tập dữ liệu hợp lý và thời gian đào tạo đủ, mô hình AI có thể dần dần tìm hiểu các quy luật và đặc điểm trong dữ liệu, từ đó cải thiện độ chính xác và chính xác của mô hình.
② Hỗ trợ khả năng khái quát hóa của mô hình: Việc huấn luyện giúp mô hình có khả năng khái quát hóa, nghĩa là nó có thể xử lý các mẫu dữ liệu mới ngoài tập huấn luyện và đóng vai trò trong các tình huống khác.
③ Cải thiện độ tin cậy của mô hình: Việc đào tạo có thể làm cho mô hình AI có khả năng xử lý tốt hơn và độ bền cao hơn đối với một số dữ liệu nhiễu, dữ liệu giả mạo và dữ liệu bị nhiễu.
④ Cập nhật và lặp lại mô hình AI: Thông qua đào tạo, mô hình AI có thể được cập nhật và cải tiến liên tục để đáp ứng nhu cầu ứng dụng thực tế.
⑤ Cải thiện khả năng diễn giải mô hình: Khả năng diễn giải của mô hình dữ liệu AI rất quan trọng trong nhiều lĩnh vực. Thông qua đào tạo, khả năng diễn giải và tính minh bạch của mô hình có thể được cải thiện, giúp dễ hiểu và sử dụng hơn.
2.3.2 Các kịch bản huấn luyện ảnh hưởng đến tốc độ tiến hóa
Việc thiết lập và lựa chọn các kịch bản đào tạo có ý nghĩa quan trọng đối với hiệu suất và hiệu suất của mô hình AI, điều này quyết định trực tiếp đến chất lượng và khả năng sử dụng của mô hình. Trong quá trình đào tạo, cần xử lý trước dữ liệu, chọn thuật toán phù hợp, tối ưu hóa siêu tham số thuật toán, kiểm soát mức độ phù hợp và quá mức, v.v. để làm cho kết quả đào tạo mô hình AI chính xác và đáng tin cậy hơn. Những nhiệm vụ quan trọng nhất này về cơ bản dựa vào sự tham gia thủ công, điều này cũng phản ánh vị thế của “con người” là nguồn lực chiến lược cốt lõi.
① Kịch bản học có giám sát: Bằng cách cung cấp tập dữ liệu được gắn nhãn cho mô hình, cho biết dữ liệu thuộc về danh mục hoặc giá trị mục tiêu nào, v.v.
② Kịch bản học không giám sát: Tập dữ liệu huấn luyện không có nhãn hoặc giá trị đích cụ thể, mô hình cần tự khám phá các quy luật và đặc điểm của dữ liệu theo đặc điểm thống kê của tập dữ liệu để xử lý và phân loại dữ liệu.
③ Kịch bản học bán giám sát: Chứa dữ liệu được gắn nhãn và không được gắn nhãn, đồng thời mô hình cần học cách phân loại các dữ liệu không được gắn nhãn này.
④ Kịch bản học tăng cường: Mô hình liên tục tương tác với môi trường, quan sát và tương tác với môi trường tại mọi thời điểm, đồng thời điều chỉnh chiến lược của mô hình dựa trên thông tin phản hồi.
⑤ Kịch bản xử lý ngôn ngữ tự nhiên: Tập dữ liệu huấn luyện nói chung là một lượng lớn dữ liệu văn bản và mô hình cần học cách hiểu dữ liệu văn bản và mối quan hệ giữa các văn bản.
⑥ Kịch bản thị giác máy tính: Tập dữ liệu huấn luyện thường là dữ liệu hình ảnh hoặc video và mô hình cần học cách hiểu và xử lý những dữ liệu hình ảnh này để đạt được các nhiệm vụ như phát hiện mục tiêu và nhận dạng hình ảnh.
03 "Các kịch bản sử dụng của người dùng" là những nguồn lực chiến lược tổng thể rất khan hiếm.
Hiện tại, có những hạn chế và hạn chế nhất định nhằm nâng cao độ chính xác và mức độ thông minh của các sản phẩm trí tuệ nhân tạo bằng cách mở rộng phần cứng máy tính và mở rộng cơ sở dữ liệu. Một mặt, việc mở rộng phần cứng máy tính và mở rộng cơ sở dữ liệu đòi hỏi sự đầu tư lớn về nhân lực, tài chính và thời gian, khi quy mô của hệ thống tiếp tục mở rộng thì nhu cầu về tài nguyên sẽ tăng lên. Mặt khác, sự phát triển công nghệ trong lĩnh vực trí tuệ nhân tạo hiện nay vẫn phải đối mặt với nhiều yếu tố chưa chắc chắn, như hiệu quả của thuật toán và hiệu quả của việc tự học. Những yếu tố này sẽ ảnh hưởng đến không gian phát triển của các sản phẩm trí tuệ nhân tạo.
So với dữ liệu không giới hạn, cuộc cạnh tranh về tài nguyên người dùng là một trò chơi có tổng bằng 0. Nếu một sản phẩm trí tuệ nhân tạo có số lượng người dùng lớn và được sử dụng thường xuyên, nó có thể nhận ra sự nâng cấp thông minh của sản phẩm trí tuệ nhân tạo thông qua việc giám sát và phân tích dữ liệu sử dụng của người dùng, liên tục cải tiến hệ thống sản phẩm và tăng giá trị sử dụng.
Nhiều người dùng hơn tạo ra một nền tảng tiên tiến hơn; một nền tảng tiên tiến hơn tạo ra trải nghiệm tốt hơn; trải nghiệm tốt hơn sẽ thu hút nhiều người dùng hơn.
Hiệu ứng Matthew đề cập đến hiện tượng trong những điều kiện nhất định, những tài năng xuất chúng liên tục được hỗ trợ, dẫn đến khoảng cách giữa các tài năng ngày càng lớn.
Trong quá trình phát triển trí tuệ nhân tạo, các công nghệ tiên tiến hoặc các công ty tiên tiến thường dễ dàng có được nhóm người dùng và thị phần đầu tiên hơn, dẫn đến đầu tư nhiều hơn và lợi nhuận tốt hơn. Hiện tượng này sẽ củng cố hơn nữa vị trí dẫn đầu của ngành.
Mặt khác, việc phát triển công nghệ AI cũng đòi hỏi một lượng lớn nhân tài có chuyên môn. Các công ty và nền tảng hàng đầu có đủ nguồn lực để tiếp tục đầu tư thêm kinh phí và nguồn lực nhằm đạt được lợi thế về nhân tài, khiến những người đi sau hoàn toàn mất khả năng bắt kịp.
Điều quan trọng nhất là nền tảng hàng đầu sẽ mang lại trải nghiệm người dùng tốt hơn. Hiện tại, hiệu ứng Matthew trong thị trường AI đến C đã được nêu bật. Từ góc độ tâm lý người dùng, người dùng đã quen với việc sử dụng một loại sản phẩm AI cần phải tìm hiểu lại và thích nghi khi chuyển sang sản phẩm khác cùng loại, đòi hỏi nhiều thời gian và công sức. Từ góc độ quy mô dữ liệu, việc tích lũy một lượng lớn dữ liệu người dùng có ý nghĩa rất lớn đối với hiệu quả sử dụng và phân tích sản phẩm. Việc giữ lại dữ liệu người dùng là chìa khóa để thiết lập các sản phẩm đó. Sản phẩm mới có những nhược điểm cố hữu. “Hiệu ứng bánh đà” tự nhiên của hệ thống AI càng khuếch đại hơn nữa việc thể hiện “Hiệu ứng Matthew” trong trải nghiệm người dùng.
##04 Kết luận
Một câu nói thú vị: AI là cung tên của thời kỳ đồ đá mới.
Khả năng học tập được hình thành bởi AI phụ thuộc vào quy mô của các tham số. Theo kinh nghiệm học thuật, khả năng học của mạng lưới thần kinh sâu có mối tương quan thuận với thang đo tham số của mô hình, tức là mô hình càng nhiều tham số thì khả năng học càng mạnh. GPT-2 có khoảng 1,5 tỷ tham số, trong khi mẫu GPT-3 lớn nhất có 175 tỷ tham số, tăng gấp hai bậc. Theo đồn đoán của giới truyền thông nhưng tin tức chưa được xác nhận thì thông số của GPT-4 có thể lên tới 100 nghìn tỷ.
Một số chuyên gia trong ngành tin rằng công nghệ cứng cung cấp các thành phần chính và giao diện phần cứng để phát triển "công nghệ mềm" và đổi mới theo nhu cầu của chuỗi cung ứng "công nghệ mềm". “Công nghệ mềm” là “đường vàng” vượt trên những khúc cua, chuyển làn để đổi mới công nghệ.
CCTV đã tìm ra một sự kết hợp hiệu quả: đầu tiên, nó tinh chỉnh nhu cầu của người dùng thành một loạt các hướng trao quyền cho AI như hỗ trợ y tế, hỗ trợ nông nghiệp, hỗ trợ làm đẹp và hỗ trợ sinh viên, sau đó nâng tầm tổng thể thông qua kết hợp ngữ nghĩa tìm kiếm mờ. tài nguyên xây dựng các mô hình sử dụng tần số cao trong các tình huống ứng dụng khác nhau, hình thành khả năng tự học về "sức mạnh mềm" như cơ sở kiến thức và thuật toán, buộc phải xây dựng sức mạnh cứng như sức mạnh tính toán GPU và băng thông CDN. Nắm chắc “kịch bản sử dụng của người dùng” là “người chiến thắng”.
Điều thú vị là định hướng kỹ thuật của GPT hiện đã rõ ràng và không có trở ngại kỹ thuật nào không thể vượt qua. Chúng ta có thể vận dụng tinh thần “trường tồn” mà người Trung Quốc giỏi nhất để bắn cung tên “Thời đại đồ đá mới” này một cách chính xác và xa nhất.