Hồ sơ thực địa: Con ngựa đen của tinh thần kinh doanh *
Thế giới đã trở lại diện mạo trước đây, và một số người nói rằng Robin có một quảng cáo nghiêm túc trên sân khấu, tiết lộ cảm giác tương lai và sự tò mò của các sản phẩm công nghệ. Đó là niềm hy vọng và sự cộng hưởng của tương lai của công nghệ trong và ngoài sân khấu, của công ty và người dùng.
Đại hội Thế giới Baidu 2023 là hội nghị ra mắt chiến lược, công nghệ và sản phẩm quan trọng nhất của Baidu, được tổ chức trong 17 năm kể từ năm 2006.
**Ngày 17/10, con ngựa đen của doanh nhân được mời tham gia Hội nghị Thế giới Bạch Đô, ghi lại 10 nội dung quan trọng ngay tại chỗ, sắp xếp toàn bộ nội dung bài phát biểu của Robin Li và chia sẻ với mọi người. **
Chào mừng bạn đến với kỷ nguyên của trí tuệ nhân tạo thế hệ! Sự đổi mới lớn nhất trong công nghệ trong năm qua là sự xuất hiện của trí thông minh từ các mô hình lớn, là nền tảng để phát triển các ứng dụng gốc AI. Wenxin Model 4.0 đã chính thức được phát hành, nhận ra sự nâng cấp toàn diện của mô hình cơ bản và đã cải thiện đáng kể khả năng hiểu biết, thế hệ, logic và bộ nhớ của nó, và mức độ toàn diện không kém gì GPT-4.
2.AI ứng dụng gốc là các ứng dụng được phát triển dựa trên khả năng hiểu, tạo, logic và bộ nhớ của các mô hình lớn. Những khả năng này không có sẵn trong các thời đại trước, do đó mở ra không gian không giới hạn cho sự đổi mới.
AI tạo ra và tìm kiếm là một trận đấu được tạo ra trên thiên đường. Tìm kiếm Baidu đã được xây dựng lại dựa trên mô hình lớn AI và tìm kiếm mới có ba đặc điểm: cực kỳ hài lòng, kích thích đề xuất và tương tác nhiều vòng. Nó không chỉ cải thiện chất lượng tìm kiếm mà còn phá vỡ phạm vi ứng dụng tìm kiếm và mở rộng ranh giới sản phẩm.
Baidu GBI là sản phẩm kinh doanh thông minh đầu tiên ở Trung Quốc, có thể rút ngắn công việc phân tích dữ liệu và viết báo cáo mà các nhà phân tích kinh doanh có thể hoàn thành trong hơn mười ngày xuống mức phút và là một công cụ ra quyết định dựa trên khả năng mô hình lớn.
Thư viện Baidu là sản phẩm toàn diện nhất của việc tái tạo AI. Baidu Wenku, dựa trên việc tái tạo mô hình lớn, đã được công bố, chuyển đổi từ "công cụ nội dung" sang "công cụ năng suất". Nó nhanh chóng phát triển trong các chức năng như hiểu tài liệu, viết bài, tạo thông minh PPT và chuyển đổi kiểu.
Đĩa mạng Baidu đã hoàn thành tái tạo AI. Trợ lý thông minh đám mây cá nhân "Cloud One" nhận ra sự chuyển đổi từ tương tác giao diện đồ họa sang tương tác ngôn ngữ tự nhiên, nâng cao hiểu biết thông tin đa phương thức và có thể định vị chính xác video, tóm tắt nội dung video chỉ bằng một cú nhấp chuột và tinh chỉnh các câu vàng, dẫn đầu thế giới.
Plug-in là một ứng dụng gốc AI đặc biệt, với ngưỡng thấp nhất và dễ sử dụng nhất. Trình cắm tăng cường khả năng của các mô hình lớn, làm cho chúng thực tế hơn và dễ sử dụng hơn, đồng thời làm cho nhiều dữ liệu riêng tư của doanh nghiệp có thể được sử dụng dễ dàng và nhanh chóng mà không có nguy cơ rò rỉ.
Các ứng dụng gốc AI trong tương lai phải đa phương thức và lái xe tự động là một ứng dụng điển hình của các mô hình lớn trực quan để tái tạo lại thế giới vật lý.
Baidu đang thúc đẩy mạnh mẽ sự tích hợp sâu sắc của công nghệ kỹ thuật số và nền kinh tế thực, và công nghệ mô hình lớn đã được áp dụng trong sản xuất, năng lượng, điện, công nghiệp hóa chất, giao thông vận tải và các ngành công nghiệp thực tế khác, sử dụng kiểm tra thông minh để giảm các mối nguy hiểm an toàn tiềm ẩn, sử dụng lập lịch thông minh để rút ngắn chu kỳ giao hàng, sử dụng ra quyết định thông minh để nâng cao hiệu quả doanh nghiệp, kiểm soát thông tin thông minh để giải quyết tắc nghẽn giao thông và mô hình lớn đang trở thành động lực quan trọng cho công nghiệp hóa mới.
Chúng ta sắp bước vào kỷ nguyên AI bản địa, kỷ nguyên tương tác giữa người và máy tính!
**Sau đây là toàn văn bài phát biểu của người sáng lập Baidu và CEO Robin Li, được biên tập bởi Dark Horse of Entrepreneurship: **
Xin chào quý khách! Chào mừng bạn đến với Đại hội Thế giới Baidu 2023!
Chào mừng bạn đến với kỷ nguyên của AI tạo ra! **
**Chủ đề của hội nghị này là các ứng dụng gốc AI. Tôi sẽ chia sẻ với bạn chi tiết kinh nghiệm của Baidu trong quá trình tái tạo bản địa AI của các dòng sản phẩm khác nhau của mình trong vài tháng qua và tôi hy vọng nó sẽ hữu ích cho bạn. **
Như chúng ta đã biết, các ứng dụng gốc AI được phát triển dựa trên các mô hình lớn. Sự đổi mới lớn nhất trong lĩnh vực công nghệ trong năm qua chắc chắn là sự xuất hiện của trí thông minh do các mô hình lớn mang lại, là nền tảng để phát triển các ứng dụng gốc AI.
Do đó, các ứng dụng gốc AI của Baidu cũng được phát triển dựa trên từ Wen Xin của chúng tôi. Những lời của Wen Xin được phát hành lần đầu tiên vào ngày 16 tháng 3 năm nay, và kể từ đó chúng tôi đã nhanh chóng lặp lại và được chấp thuận mở cửa ra thế giới vào ngày 31 tháng 8, thu được rất nhiều phản hồi của người dùng và tốc độ đổi mới đang tăng tốc.
Hôm nay, tôi vui mừng thông báo về việc phát hành chính thức của Wenxin Grand Model 4.0.
Chúng tôi cũng bắt đầu mời các bài kiểm tra cùng một lúc. Bạn bè tại hiện trường, bạn chỉ cần quét mã QR trên thẻ khách, nhận phiếu trải nghiệm và bạn có thể đăng nhập vào trang web chính thức của Wenxin Yiyan hoặc Ứng dụng Wenxin Yiyan để trải nghiệm Wenxin Model 4.0.
Đây là mô hình lớn Wenxin mạnh nhất cho đến nay, nó đã đạt được sự nâng cấp toàn diện về mô hình cơ bản, sự hiểu biết, thế hệ, logic và bộ nhớ bốn khả năng chính, so với phiên bản hiện tại của Wenxin Yiyan đã được cải thiện đáng kể, mức độ toàn diện không kém GPT4!
**Cái gọi là ứng dụng gốc AI, theo tôi hiểu, là một ứng dụng được phát triển dựa trên khả năng hiểu, tạo, logic và bộ nhớ của các mô hình lớn. Những khả năng này không có sẵn trong các thời đại trước, vì vậy chúng có thể mở ra không gian không giới hạn cho sự đổi mới. **
Dưới đây tôi sẽ kết hợp các kịch bản ứng dụng để giới thiệu cho bạn bốn khả năng trong lời nói của Wen Xin. Ứng dụng với bốn khả năng này là ứng dụng gốc của kỷ nguyên AI.
** Đầu tiên là khả năng hiểu. Đây là điều tuyệt vời nhất mà tôi cảm thấy sau khi tiếp xúc với người mẫu lớn. **
Trước đây, chúng ta đã nói AI là "khuyết tật trí tuệ nhân tạo", tức là AI thường không thể hiểu được lời nói của con người, và theo thời gian, bạn không dám nói chuyện với nó quá nhiều.
Hôm nay, mỗi từ bạn nói, rất có thể nó có thể hiểu, tốt hơn nhiều lần so với bạn bè và đồng nghiệp của bạn hiểu những gì bạn đang nói.
Ví dụ, bạn là một thanh niên làm việc tại Bắc Kinh muốn mua nhà ở Hà Bắc và muốn biết liệu bạn có thể đăng ký khoản vay quỹ dự phòng ở Bắc Kinh hay không.
Hãy nhập một dòng.
[Tôi muốn về Thừa Đức mua nhà, tôi có thể dùng vốn vay quỹ dự phòng không, làm thủ tục thì phải làm sao?] Tôi làm việc ở Bắc Kinh. 】
Chúng ta hãy xem kết quả. Wen Xin trả lời rằng anh ta có thể sử dụng khoản vay quỹ dự phòng. Tại sao phần Hỏi & Đáp này phản ánh khả năng hiểu mô hình lớn? Trên thực tế, những gì tôi đưa ra vừa rồi, có vẻ đơn giản, có một số cạm bẫy nhỏ để hiểu:
Trước hết, đó là một biểu hiện qua lại. Khi hầu hết mọi người gọi điện để đặt câu hỏi, họ nghĩ đến nơi để nói, không quá nghiêm ngặt, như thế này, đầu tiên tôi nói về việc mua nhà và xử lý quỹ dự phòng, và cuối cùng nói "Tôi làm việc ở Bắc Kinh", điều này đưa ra yêu cầu cao hơn về sự hiểu biết.
Thứ hai, tôi cố tình sử dụng hai cách diễn đạt mơ hồ ở đây. Một là "làm việc ở Bắc Kinh", ẩn ý là "gửi tiền quỹ dự phòng ở Bắc Kinh", hai là "trở về Thừa Đức mua nhà", chỉ là một từ "trả lại", trên thực tế, ngụ ý rằng tôi rất có thể là một hộ khẩu Thừa Đức.
Thứ ba, Wen Xin kết hợp bối cảnh và kết hợp tất cả các điểm thông tin lại với nhau để hiểu chính xác câu hỏi thực sự, đó là "người dùng có hộ khẩu ở Thừa Đức, tỉnh Hà Bắc, có thể sử dụng quỹ dự phòng của Bắc Kinh để mua nhà ở Thừa Đức bằng một khoản vay không", sau đó đưa ra câu trả lời và các bước xử lý cho câu hỏi này.
Có thể thấy rằng lời nói của Wen Xin, đã có thể hiểu khá chính xác về "cách diễn đạt không theo thứ tự, ý định biểu đạt tương đối mơ hồ và ẩn ý trong lời nói". Khả năng này có rất nhiều triển vọng ứng dụng trong các vấn đề của chính phủ, tiếp thị, dịch vụ khách hàng và các lĩnh vực khác.
**Khả năng quan trọng thứ hai của các mô hình lớn là "thế hệ", có thể tạo ra nội dung đa phương thức như văn bản, hình ảnh và video. **
Vậy làm thế nào để sử dụng sức mạnh thế hệ? Tôi yêu cầu Wen Xin tạo ra một bộ sáng tạo trong một từ.
Nhập một hình ảnh vào đó trước, sau đó nhập một đoạn văn.
[Đây là phương tiện năng lượng mới của Trường An.] Xin vui lòng giúp tôi tạo ra hai hình ảnh với một mùa xuân, phong cảnh sống động ở hậu cảnh, và cảm giác của chiếc xe tăng tốc. 】
Chúng ta thấy rằng thế hệ này sử dụng khung cảnh ngoài trời rực rỡ của mùa xuân, kèm theo sự mờ nhạt của việc tăng tốc.
Tôi đã yêu cầu nó tạo ra một poster dọc trực tiếp cho tôi.
[Kết hợp với thông tin của Changan Qiyuan trên trang web chính thức của Changan, làm một poster quảng cáo dọc và viết bản sao tiếp thị đơn giản và thanh lịch, lặp lại phong cách cơ thể. ] 】
Như bạn có thể thấy, chúng tôi đã tạo ra một áp phích quảng cáo dọc với cả hình ảnh và văn bản.
Bây giờ chúng tôi có một poster quảng cáo, và chúng tôi cần bản sao quảng cáo phong phú hơn, bạn có thể yêu cầu Wen Xin viết thêm vài từ:
[Chiếc xe này nhấn mạnh buồng lái thông minh kỹ thuật số, thiết kế Fuguang và lái xe chất lượng. Vui lòng viết thêm 5 phần bản sao quảng cáo, mỗi phần có tiêu đề ngắn và mô tả]
Việc viết quảng cáo được viết bởi AI, có vẻ đẹp của khoa học công nghệ, xu hướng của thời đại, cũng nhấn mạnh sự tương tác giữa con người và máy tính, việc viết quảng cáo chuyên nghiệp và mượt mà hơn, đã đạt đến tiêu chuẩn tiếp thị thương hiệu.
Vậy nếu tôi vẫn muốn có video thì sao?
[Vui lòng kết hợp thông tin trang web chính thức và nội dung video hiện có để tạo video bằng miệng kỹ thuật số của con người, tôi muốn chạy quảng cáo trong nguồn cấp dữ liệu.] 】
Nó đã được tạo, sau đó chúng tôi mở video để xem hiệu ứng.
Đây thực sự là một video phát sóng dân số kỹ thuật số đặc biệt hơn, và nó cũng phản ánh các đặc điểm của chiếc xe này.
Bây giờ, chúng tôi có 1 bộ phim thương mại, 5 bản quảng cáo và 1 poster, và tôi chỉ đưa cho Wen Xin một từ của một tài liệu hình ảnh và một vài từ như "xe thông minh kỹ thuật số" và "lái xe chất lượng", và toàn bộ quá trình chỉ mất chưa đầy 3 phút.
Cách đây không lâu, chúng tôi cũng đã sử dụng tính năng này để ra mắt nền tảng sáng tạo tiếp thị AIGC Steering Engine, cho phép một người trở thành nhóm tiếp thị AI. Có thể có một số người bạn copywriting trên hiện trường ngày hôm nay, nhìn thấy điều này, bạn có nghĩ rằng các mô hình lớn có thể mang lại nhiều cảm hứng sáng tạo hơn và giúp bạn nâng cao hiệu quả?
Tiếp theo, hãy nói về khả năng thứ ba của các mô hình lớn: logic. **
Nhiều người thường phải giúp con làm bài tập về nhà. Một số người nói đùa rằng "nếu bạn không viết bài tập về nhà, người mẹ là người hiếu thảo, và khi bạn viết bài tập về nhà, con gà bay và nhảy." Vậy hãy xem nào, liệu những lời của Wen Xin có thể giúp phụ huynh giải quyết vấn đề dạy kèm bài tập về nhà không?
Hãy để tôi tạo ra một vấn đề toán học và xem nó hoạt động như thế nào:
[Đống cát hình nón, diện tích đáy là 8 mét vuông, chiều cao là 12 decimet, trải đống cát này trên một con đường rộng 2 mét, dày 5 cm, có thể trải bao nhiêu mét? ] 】
Đây là một loại vấn đề toán học mà chúng ta có thể đã làm khi còn nhỏ, và đánh giá từ câu trả lời của Wen Xin, logic trả lời của nó khá rõ ràng. Mỗi bước được viết. Phụ huynh có thể xem nếu nó chi tiết hơn những gì được đưa ra trong một số tài liệu dạy kèm.
Thậm chí, AI có thể chỉ ra những điểm kiến thức được sử dụng trong việc giải quyết vấn đề để giúp trẻ củng cố việc học, hãy hỏi lại:
[Những điểm kiến thức nào liên quan đến quá trình giải quyết vấn đề trên?] 】
Wen Xin rõ ràng đã đưa ra các điểm kiến thức liên quan đến câu hỏi này, chẳng hạn như công thức thể tích hình nón, đơn vị đo lường thống nhất, thể tích không thay đổi và giải phương trình. Điều này rất thiết thực cho học sinh, giáo viên và phụ huynh. Sau khi những điểm kiến thức này được nắm vững rõ ràng, trẻ sẽ có khả năng rút ra suy luận từ nhau.
Khả năng siêu logic của mô hình lớn chắc chắn không chỉ có thể được sử dụng để giải quyết vấn đề. Lập kế hoạch tuyến đường cho bản đồ thông minh, trợ lý thông minh cho các tác vụ phức tạp, điều khiển đèn giao thông trong hệ thống giao thông thông minh, v.v. đều yêu cầu sử dụng khả năng logic.
Tiếp theo, chúng ta hãy xem xét điểm thứ tư, đó là khả năng ghi nhớ của mô hình lớn. **
Bộ nhớ ở đây chủ yếu đề cập đến những gì bạn đã nói trước đó, liệu AI có nhớ nó hay không, nội dung do AI tạo ra có mâu thuẫn hay không. Đây là một chỉ số quan trọng để phân biệt trí thông minh của các mô hình lớn và đối thoại nhiều vòng là hiện thân của khả năng ghi nhớ.
Tôi biết rằng nhiều nhà sáng tạo đang sử dụng Wen Xin để viết tiểu thuyết. Và nếu nội dung của cuốn tiểu thuyết không nhất quán, thì nó không thể đọc được. Hôm nay, tôi sẽ yêu cầu nó viết một cuốn tiểu thuyết ngay tại chỗ, xen kẽ một số phiền nhiễu với các câu hỏi và xem liệu nó có thể nhớ những gì nó đã viết không.
Tôi sẽ nhập một cái trước:
[Xin hãy giúp tôi viết một cuốn tiểu thuyết võ thuật, nhân vật chính là một người phụ nữ, và cốt truyện có những thăng trầm. ] 】
Chà, hãy xem, phác thảo của cuốn tiểu thuyết đã xuất hiện:
Đầu tiên là bối cảnh của câu chuyện, trong thế giới võ thuật cổ đại, thế lực hắc ám đang trỗi dậy; Tên của nữ chính là Ling'er, và cô ấy có sức mạnh để thao túng nội lực và bay.
Tôi sẽ nhập một cái trước:
[Xin hãy giúp tôi viết một cuốn tiểu thuyết võ thuật, nhân vật chính là một người phụ nữ, và cốt truyện có những thăng trầm. ] 】
Chà, hãy xem, phác thảo của cuốn tiểu thuyết đã xuất hiện:
Đầu tiên là bối cảnh của câu chuyện, trong thế giới võ thuật cổ đại, thế lực hắc ám đang trỗi dậy; Tên của nữ chính là Ling'er, và cô ấy có sức mạnh để thao túng nội lực và bay.
Tiếp theo, có phần đầu của câu chuyện. Ling'er muốn đánh bại thế lực hắc ám và cứu võ. Ở cao trào của cuốn tiểu thuyết, cô chiến đấu một trận chiến sinh tử với nhân vật phản diện, đánh bại nhân vật phản diện, và cứu võ thuật và tất cả các giáo phái.
Cuối cùng, Linh Nhi và đồng minh cũng cùng nhau thành lập Học viện Tu luyện Nội lực.
Bây giờ câu chuyện về cơ bản đã được hình thành, nhưng nó hơi đơn giản, tôi muốn thêm một số yêu cầu về nhân vật:
[Bây giờ mối quan hệ nhân vật quá đơn giản, chỉ có hai nhân vật, và thêm 4 ký tự nữa]
Wen Xin đã giao thêm bốn vai diễn trong một từ, mỗi vai có một thân phận và tính cách khác nhau, với một tính cách khác nhau, Murong Gucheng này là một thế hệ chưởng môn, và có một nhà tiên tri Xiao Hanyan có thể dự đoán tương lai.
Nhưng bây giờ vẫn còn một yếu tố cần thiết trong tiểu thuyết, xung đột kịch tính. Một câu chuyện không có xung đột thì không phải là một câu chuyện hay, và quá trình nữ chính đánh bại thế lực hắc ám vừa rồi quá đơn giản, hãy xem liệu chúng ta có thể làm cho nó khó khăn hơn không.
Nhập một cái khác
[Cũng cần thêm xung đột kịch tính của dòng chính vào câu chuyện để câu chuyện dễ xem hơn]
Chúng ta thấy, nó đã được viết cho xung đột kịch tính. Đây là một sự đảo ngược, đằng sau thế lực hắc ám, thủ lĩnh thực sự là một nhân vật cấp đại kiện tướng rất được kính trọng, điều này đã khiến nữ chính gặp nguy hiểm nhiều lần. Cho đến trận chiến quyết định, nữ chính đã có cơ hội chống trả.
Như bạn có thể thấy, nó nhớ rằng dòng chính của câu chuyện là cuộc đối đầu giữa Ling'er và thế lực hắc ám, và xung đột cũng xoay quanh dòng chính này.
Vậy, Wen Xin có còn nhớ câu chuyện anh vừa viết, và tương quan những nhân vật này với câu chuyện không?
Hãy đưa ra một yêu cầu nữa:
[Đưa những nhân vật này vào phác thảo của câu chuyện mà bạn đã thiết kế cho tôi, và thiết kế một tiêu đề.] 】
Kết quả đã được chiếu trên màn ảnh rộng, và cuốn tiểu thuyết được gọi là "Trận chiến chính nghĩa của sông hồ", bổ sung thêm các nhân vật bổ sung và xung đột kịch tính vào phác thảo câu chuyện. Chương thứ tư và thứ năm ở đây cũng cho chúng ta biết rằng đại sư của nhân vật phản diện này là Tống Cổ Thành vừa được giới thiệu.
Trong toàn bộ quá trình, tôi liên tục tăng độ khó và đưa ra các yêu cầu mới để can thiệp vào bộ nhớ của nó, và Wen Xin vẫn nhớ tất cả các nhu cầu và câu trả lời trước đó, và có thể tương ứng chính xác cốt truyện và nhân vật, và trí nhớ của anh ấy rất tuyệt vời.
Rồi tất cả mọi người ở hiện trường thử nghiệm bây giờ, các bạn có nhớ, khả năng đặc biệt của nhân vật chính Linger là gì?
Có lẽ hầu hết mọi người không nhớ, vì vậy hãy xem Wen Xin có nhớ không?
[Khả năng của nữ chính là gì?] 】
Vâng, câu trả lời đã được đưa ra, đó là sức mạnh để thao túng nội lực và bay. Đây là văn bản ví dụ được viết bởi Wen Xin trong vòng đối thoại đầu tiên. Bây giờ, sau năm vòng đối thoại và vài ngàn từ hư cấu, nó vẫn có thể nhớ những gì nó đã viết trước đó, đó là khả năng ghi nhớ của mô hình lớn.
Chúng tôi vừa trải nghiệm bốn khả năng của mô hình lớn, tất nhiên, hầu hết thời gian, bốn khả năng này không xuất hiện một mình, chúng bổ sung cho nhau. **
Ví dụ, để tạo ra một bản sao quảng cáo, nó cần hiểu chủ đề sáng tạo, làm rõ logic của sáng tạo và duy trì tính nhất quán thông qua bộ nhớ.
Trong giải quyết vấn đề, cũng cần vận dụng toàn diện khả năng hiểu, sáng tạo, logic và ghi nhớ.
Hãy xem xét một ví dụ ứng dụng toàn diện:
Trước hết, chúng tôi mở Ứng dụng Baidu được xây dựng lại, quét hộp thuốc do bệnh nhân lấy ra bằng máy ảnh và không cần phải xem qua các hướng dẫn bằng chữ in nhỏ và bác sĩ kỹ thuật số sẽ giúp bạn giải thích.
Những câu hỏi xuất hiện trên màn hình vừa rồi như "nên ăn trước hay sau bữa ăn", "uống rượu có ăn được không", "còn những biện pháp phòng ngừa nào khác" đang được nhiều bệnh nhân dùng thuốc hàng ngày sẽ gặp phải vấn đề.
Chúng tôi thấy rằng mô hình lớn không chỉ có thể giúp bệnh nhân giải thích các hướng dẫn về thuốc mà còn kết hợp các nhu cầu được cá nhân hóa để nâng cao hiệu quả của thuốc và đảm bảo tính chính xác và kịp thời của thuốc của bệnh nhân.
Cách đây không lâu, chúng tôi đã kết hợp mô hình Wen Xin với kiến thức y học chuyên môn và phát hành Mô hình lớn Spirit Medicine, có thể giúp bệnh nhân và bác sĩ nói chuyện và tạo hồ sơ y tế bằng cách áp dụng Bot Spirit Medicine. Ví dụ này không chỉ sử dụng khả năng hiểu và tạo ra bộ nhớ logic mà còn cả khả năng nói đa phương thức, tầm nhìn, v.v.
Cuộc trình diễn trước đó chủ yếu phản ánh sự tiến bộ của mô hình Wenxin trong bốn khả năng hiểu, thế hệ, logic và bộ nhớ, là cơ sở cho sự tồn tại của tất cả các ứng dụng gốc AI. Tương tự, nếu không có một hệ sinh thái ứng dụng gốc AI phong phú được xây dựng trên mô hình cơ bản, một mô hình lớn là vô giá trị.
Tôi đã công khai nói vào tháng Năm rằng Baidu sẽ là công ty đầu tiên tái cấu trúc tất cả các sản phẩm và chúng tôi sẽ sử dụng tư duy AI để tạo ra các ứng dụng gốc AI.
** Trong vài tháng qua, các tìm kiếm của chúng tôi, chẳng hạn như luồng, bản đồ, đĩa trực tuyến, thư viện, v.v., sẽ đáp ứng bạn với một giao diện mới. Trong suốt thời gian đó, tôi đã dẫm lên rất nhiều hố sâu, và tôi sẵn sàng chia sẻ với các bạn, tôi hy vọng các bạn có thể đi những con đường ít quanh co hơn trong quá trình phát triển. **
Tiếp theo, tôi sẽ cho bạn thấy những sản phẩm này được xây dựng lại với các mô hình lớn trông như thế nào? Điều này cũng nhằm mở rộng trí tưởng tượng của mọi người và truyền cảm hứng cho mọi người tạo ra các ứng dụng gốc AI tuyệt vời hơn.
Điều đầu tiên tôi chỉ cho bạn là tìm kiếm, đó là nơi Baidu bắt đầu. Ấn tượng của nhiều người về tìm kiếm là bạn nhập một từ khóa và Baidu cung cấp cho bạn một liên kết web. Không còn nữa!
Baidu tìm kiếm mới, khi mở giao diện, ngoài việc nhìn thấy hộp tìm kiếm, kết quả tìm kiếm sẽ hoàn toàn khác so với trước đây.
** Tìm kiếm mới được xây dựng lại có ba đặc điểm: cực kỳ hài lòng, kích thích đề xuất và nhiều vòng tương tác. **
Sự hài lòng cuối cùng là gì? Khi bạn nhập câu hỏi vào hộp tìm kiếm, chẳng hạn như "MBTI là gì?" "Làm thế nào để đậu xe bên cạnh", tìm kiếm mới không còn là cung cấp cho bạn một loạt các liên kết, mà là để hiểu thông qua mô hình lớn và tạo ra câu trả lời tốt nhất
Ví dụ: nếu bạn hỏi "xếp hạng giá trị gia tăng công nghiệp theo quốc gia trong 20 năm qua", tìm kiếm mới sẽ không chỉ cho bạn câu trả lời trực tiếp mà còn hiển thị câu trả lời bằng biểu đồ động.
Từ màn hình lớn phía sau tôi, tôi có thể thấy rằng trong hai thập kỷ qua, ngành công nghiệp sản xuất công nghiệp của chúng ta đã trải qua sự phát triển nhanh chóng và đang chuyển đổi từ một quốc gia sản xuất sang một cường quốc sản xuất.
Đây là sự hài lòng cuối cùng: một bước để cung cấp cho bạn câu trả lời cuối cùng.
Vì vậy, bước thứ hai, sau khi nhìn thấy câu trả lời, bạn còn muốn thấy gì nữa?
Đây là nơi kích thích khuyến nghị được sử dụng. Ví dụ, sau biểu đồ động, hàm kích thích khuyến nghị cũng đưa ra "mối quan hệ giữa giá trị gia tăng công nghiệp và GDP là gì" và "tác động của ngành công nghiệp đối với sự phát triển của nền kinh tế quốc gia" những câu hỏi này bạn cũng có thể quan tâm. Nhấp để nhận câu trả lời.
Tất nhiên, không phải tất cả các nhu cầu đều có một câu trả lời đúng duy nhất. Nhu cầu của người dùng đôi khi có thể phức tạp và không rõ ràng trong một hoặc hai câu. Người dùng cũng khó thể hiện đầy đủ một yêu cầu rất phức tạp thông qua một mô tả lớn cùng một lúc.
Lúc này, chúng ta cần sử dụng một mô hình tìm kiếm mới lạ và cá nhân hóa hơn để phục vụ người dùng, đó là: tương tác nhiều vòng.
Chúng ta hãy xem ví dụ này:
Ví dụ: nếu bạn hỏi "đâu là địa điểm được đề xuất để leo núi quanh Bắc Kinh", nó sẽ đưa ra nhiều câu trả lời như núi Baihua và núi Haituo, thiên về các tuyến đường đi bộ đường dài;
Sau đó, nó đưa ra một số gợi ý để bổ sung cho sự lựa chọn tình huống của bạn, bạn có thể chọn giữa người mới bắt đầu, cha mẹ-con cái và xem lá rụng. Bây giờ, nó đã thay đổi để giới thiệu Núi Tây và Núi Baiwang, tương đối dễ leo lên và thân thiện hơn với các hoạt động của cha mẹ và con cái.
Sau đó tiếp tục hỏi, bạn cần thiết bị gì để leo núi và đi bộ đường dài? Câu trả lời là cột trekking, giày đi bộ đường dài, v.v., và nó cũng nhớ rằng nó đã chọn một tour du lịch cha mẹ và con cái sớm hơn, và đặc biệt là đưa ra lời khuyên về cách chăm sóc trẻ em.
Có thể nói, AI và tìm kiếm là một trận đấu được tạo ra trên thiên đường.
Tìm kiếm tuy vẫn bắt đầu từ ô đơn giản đó, nhưng từng bước tiếp theo, đã vượt qua và xây dựng lại chế độ tìm kiếm ban đầu, không chỉ nâng cao chất lượng tìm kiếm mà còn đột phá phạm vi ứng dụng tìm kiếm và mở rộng ranh giới sản phẩm. như vậy
Tìm kiếm tương tác AI sẽ dẫn dắt sự chuyển đổi thế hệ của ngành công nghiệp tìm kiếm.
Trong tương lai gần, tìm kiếm sẽ trở thành một trợ lý thân mật, có thể gợi mở, giải quyết vấn đề và thậm chí phá vỡ giới hạn của "kết thúc" bất cứ lúc nào, để đáp ứng mọi lúc, mọi nơi, đáp ứng nhu cầu và đồng hành cùng toàn bộ quá trình.
Tiếp theo, chúng ta hãy xem xét sản phẩm tư duy gốc AI thứ hai, Baidu GBI, Generative Business Intelligence, tức là trí tuệ kinh doanh tổng quát. **
Đây là một sản phẩm từ đầu, không phải là tái cấu trúc của một sản phẩm hiện có. **
Trong thế giới kinh doanh của chúng ta, không thể tách rời nhất là phân tích kinh doanh, tức là BI, làm thế nào để đưa ra quyết định kinh doanh nhanh nhất? Trước tiên chúng ta hãy cảm nhận qua một video:
Như bạn có thể thấy, trong video, tổng thống đã hỏi nhiều câu hỏi chuyên môn. Có phân tích tài chính, phân phối dự án và phân tích người dùng, và trợ lý cho chủ tịch GBI có thể nhanh chóng đưa ra kết quả và để chủ tịch đưa ra quyết định ngay tại chỗ.
Đây là một công cụ ra quyết định dựa trên khả năng mô hình lớn, sản phẩm kinh doanh thông minh đầu tiên ở Trung Quốc, Baidu GBI. Với GBI, làm mọi thứ nhanh chóng!
Không chỉ con người với các công cụ tiên tiến sẽ không bị thay thế bởi AI, mà "thăng chức và tăng lương không phải là một giấc mơ". Những người không sử dụng các công cụ tiên tiến có nguy cơ mất việc. **
Vậy, Baidu GBI đã đi trước một bước như thế nào? Nó phá vỡ phân tích dữ liệu truyền thống theo ba cách:
Trước hết, BI truyền thống chỉ có thể được vận hành bởi các chuyên gia, trong khi GBI có thể trực tiếp hiểu các câu hỏi của tổng thống và thực hiện chúng trong thời gian thực;
Thứ hai, GBI cung cấp một phương thức truy cập thuận tiện, doanh nghiệp có thể truy cập dữ liệu, đặt câu hỏi và phân tích bất kỳ dữ liệu nào bằng ngôn ngữ tự nhiên và không còn cần phải thực hiện thủ công các thao tác chuyên môn khác nhau trên cơ sở dữ liệu và bảng;
Thứ ba, GBI cũng có khả năng học hỏi và các công ty có thể đưa chuyên môn ngành của mình vào để trở thành chuyên gia trong ngành.
Đây là Baidu GBI, có thể rút ngắn công việc phân tích dữ liệu và viết báo cáo mà các nhà phân tích kinh doanh có thể hoàn thành trong hàng chục ngày xuống mức phút. Cái gọi là võ công của thế giới chỉ có thể bị phá vỡ nhanh chóng;
** Doanh nghiệp cạnh tranh, không phải cá lớn ăn cá nhỏ, nhưng cá nhanh ăn cá chậm, ra quyết định nhanh hơn đối thủ, rất có khả năng bạn sẽ thắng! **
Nói về việc ra quyết định nhanh chóng, tại Baidu, chúng tôi dựa vào nền tảng văn phòng thông minh có tên Ruliu và chúng tôi cũng đã mô phỏng lại ứng dụng này với AI.
Ngày nay, nó đã trở thành một siêu trợ lý mà người Baidu không thể thiếu được.
Bây giờ mọi người hãy xem, điều này giống như một luồng thực hiện ghi âm thời gian thực. Hãy xem liệu nó có thể nhớ tất cả các điểm vừa đề cập hay không:
Đây là chức năng tạo một cú nhấp chuột của biên bản cuộc họp. Chúng tôi nói rằng làm thế nào để tiến hành các cuộc họp hiệu quả là một công việc kỹ thuật. Tính năng này giúp giảm đáng kể khối lượng công việc của cuộc họp và rút ngắn 40% thời gian họp.
Một kịch bản phổ biến khác là các nhóm làm việc. Hầu hết mọi người ở nơi làm việc thường bị tấn công bởi các tin nhắn trò chuyện nhóm khác nhau. Sau đó, nhanh chóng tóm tắt những điểm chính của cuộc trò chuyện nhóm trở thành một tính năng vô cùng hữu ích.
Chúng ta hãy xem cách các nhà quản lý sản phẩm của chúng tôi sử dụng nó.
Anh ta có 9 nhóm làm việc, trì hoãn trong một khoảng thời gian, có thể có hơn một nghìn thông tin chưa đọc và Ruliu không chỉ có thể "1000 tin nhắn, lấy nét trong một giây", mà còn chia nội dung cần đọc thành nhiều loại: "chờ tôi xác nhận", "tập trung vào", "thảo luận chủ đề", giúp cải thiện đáng kể hiệu quả công việc.
Vì vậy, nó được tinh chỉnh chính xác, nó sẽ bị hiểu lầm, hoặc nó sẽ bỏ lỡ thông tin quan trọng? Điều này kiểm tra khả năng hiểu và tạo ra các mô hình lớn. Hiểu càng sâu, tóm tắt càng chính xác. Đừng nói 1.000, 10.000 mẩu thông tin, chẳng hạn như siêu trợ lý dòng chảy cũng có thể đưa ra phân loại thông minh và tóm tắt thông minh trong vài giây.
Hãy xem xét một kịch bản khác tại nơi làm việc: du lịch.
Vé máy bay, khách sạn, đàm phán, v.v., những nhiệm vụ giao dịch này rất tẻ nhạt và tốn thời gian! Nếu bạn có một trợ lý AI để giúp bạn giải quyết các nhiệm vụ tầm thường, bạn có muốn làm việc nhiều hơn không?
Ví dụ, gần đây, giám đốc sản phẩm của Ruliu đã lên kế hoạch đến Thượng Hải để gặp ông Wang của PICC. Chúng tôi biết rằng PICC đang thúc đẩy sự đổi mới trong các sản phẩm và dịch vụ, mô hình kinh doanh, công nghệ kỹ thuật số và các khía cạnh khác, và công nghệ trí tuệ nhân tạo của chúng tôi tại Baidu có thể đóng một vai trò.
Hành trình chuyến công tác này có thể được bàn giao cho Ruliu, siêu trợ lý, và chúng ta hãy xem hiệu suất của nó.
Siêu trợ lý có thể sắp xếp chuyến đi dựa trên thông tin lịch trình của mình.
Giống như cuộc họp mới nhất kết thúc lúc 4 giờ, vì vậy hãy đặt chuyến bay sau 7:30; Và, theo tiêu chuẩn du lịch của anh ấy, giúp anh ấy tìm khách sạn nơi anh ấy có thể ở. Cuối cùng, một lời mời cho khách hàng đã được đưa ra.
Anh ta có thể cần một số nền tảng trước khi gặp khách hàng, và một siêu trợ lý cũng có thể giúp anh ta điều này. Thông qua kết nối với CRM và các dữ liệu hệ thống khác của công ty, chẳng hạn như luồng cung cấp dữ liệu chi tiết như các dự án hợp tác và hồ sơ truy cập.
Bằng cách hiểu tình hình hợp tác kinh doanh và thông tin bên ngoài, chẳng hạn như dòng chảy cũng có thể giúp anh ta tạo ra một tài liệu tham khảo thảo luận, đặt trước các câu hỏi mà khách hàng có thể hỏi và đưa ra một số đề xuất hợp tác. Từ quan điểm này, Ruliu có giống một trợ lý thực sự hơn không?
Chỉ cần ba chữ, Ruliu đã hoàn thành việc đặt phiếu du lịch, rượu máy và lịch trình, thậm chí còn chuẩn bị tài liệu tham khảo để thương lượng, đó chính là "du lịch một cú nhấp chuột" của Ruliu. Làm thế nào để nó làm điều đó?
Đây là một ứng dụng toàn diện về khả năng hiểu, tạo, logic và ghi nhớ của một mô hình lớn, tự động tháo rời các tác vụ phức tạp thành nhiều tác vụ đơn giản để thực hiện riêng biệt, sau đó hợp nhất để tạo ra kết quả cuối cùng. Chúng tôi nói rằng nâng cao hiệu quả có nghĩa là nâng cao khả năng cạnh tranh, chẳng hạn như để "công việc thông minh" thay thế "làm việc chăm chỉ".
Bây giờ, chúng ta hãy nhìn vào thư viện Baidu mới. Đây cũng là sản phẩm mà tôi nghĩ đã được tái cấu trúc hoàn toàn cho đến nay. **
Thư viện Baidu sẽ thay đổi hoàn toàn thói quen làm việc, học tập và sáng tạo của chúng ta.
Chúng tôi đã tạo ra như thế nào trong quá khứ? Ví dụ: giả sử bạn đang thuyết trình về ứng dụng AI trong tâm lý học. Phải mất vài ngày để kiểm tra thông tin, phân loại tài liệu, viết bản thảo, viết PPT và làm đẹp PPT.
Hôm nay, trên Baidu Wenko, bạn có thể bắt đầu làm việc với một câu, nhìn vào màn hình lớn: Đầu tiên, bạn muốn nó viết một bài phát biểu và nó tìm thấy hàng tá tài liệu về chủ đề trí tuệ nhân tạo và tâm lý học.
Nó cũng có thể xác định đâu là tạp chí học thuật, báo cáo có thẩm quyền và đâu chỉ là tài liệu đại chúng. Nếu bạn muốn viết một bài báo sống động, hãy chọn một số tài liệu phổ biến, chẳng hạn như bài tiểu luận và khoa học phổ biến.
Sau đó, nếu bạn muốn có một bài phát biểu học thuật nghiêm ngặt, bạn chỉ có thể kiểm tra nội dung có thẩm quyền để đảm bảo tính chính xác của nội dung. Sau đó, bằng cách hiểu các bản thảo này, thư viện tạo ra một bài viết có cấu trúc tốt và được xác định rõ, đồng thời đánh bóng và định dạng nội dung.
Điều này có thể được thực hiện bởi vì Baidu Wenku đã có 1 tỷ tài liệu chất lượng cao, dựa trên sự hiểu biết về những nội dung này, viết những tài liệu thực sự thiết thực và rõ ràng, chứ không phải là những điều vô nghĩa nghiêm trọng như nhiều mô hình lớn, cũng không phải là nói suông chung chung.
Tiếp theo, bài thuyết trình cũng cần PPT. Thư viện có thể kết hợp bản thảo vừa rồi với một số tài liệu bạn đã thu thập được để tự động tạo khuôn khổ của PPT, sau đó làm đẹp bản vẽ để tạo PPT gồm hàng chục trang.
Ngoài ra còn có một số trò chơi với khả năng tạo đa phương thức, chẳng hạn như lựa chọn phong cách và chuyển đổi kiểu bằng một cú nhấp chuột. Nhưng có một số nơi kiểm tra khả năng của thư viện nhiều hơn và đòi hỏi nó phải có sự hiểu biết chính xác về nội dung. Ví dụ, nó cần biết mối quan hệ giữa các ý tưởng, cho dù chúng nằm cạnh nhau hay phụ thuộc, để thiết kế biểu đồ chính xác.
Do khả năng hiểu này, thư viện cũng có thể viết kịch bản giọng nói tương ứng cho PPT này trên cơ sở tạo PPT. Không chỉ vậy, nó còn có thể sử dụng những nội dung này để suy luận những câu hỏi mà khán giả có thể hỏi và chuẩn bị cho bạn câu trả lời.
Chúng tôi đã đánh giá rằng khả năng tạo ra các thư viện, đặc biệt là PPT, vượt xa bất kỳ công cụ nào khác trên thị trường, dù là nước ngoài hay trong nước. Trước đây, mọi người đến thư viện để tìm nội dung làm sẵn. Trong tương lai, mọi người sẽ có thể sản xuất nội dung theo ý muốn, hiệu quả hơn bất kỳ công cụ năng suất nào khác.
Dựa trên bốn khả năng của mô hình Wenxin, không quá lời khi nói rằng Baidu Wenku về cơ bản đã cách mạng hóa cuộc sống của chính mình và hoàn thành quá trình phát triển từ "công cụ nội dung" sang "công cụ năng suất" **.
Cách đây không lâu, vào ngày đầu tiên của phiên bản mới của Baidu Wenku, chức năng AI mới đã mở ra hơn 2 triệu trải nghiệm. Bây giờ, chúng tôi tự tin hơn để nói rằng trong thời đại của các mô hình lớn, Baidu Wenku là điểm khởi đầu tốt nhất để sản xuất nội dung.
Giống như Wenku, đĩa mạng Baidu cũng là một người bạn cũ quen thuộc. Trong 11 năm qua, đĩa mạng Baidu đã phục vụ 800 triệu người dùng, khối lượng tệp đạt 4 nghìn tỷ và người dùng tải lên hơn 1 tỷ hình ảnh mỗi ngày.
Theo hướng tái thiết AI, đĩa mạng Baidu tập trung làm tốt công việc trong các dịch vụ thông minh cho các tệp cá nhân.
Những gì bạn thấy bây giờ là trang chủ mới của đĩa mạng Baidu.
** Đĩa mạng được xây dựng lại không chỉ nhận ra sự chuyển đổi từ tương tác giao diện đồ họa sang tương tác ngôn ngữ tự nhiên mà còn tăng cường hiểu biết thông tin đa phương thức. **
Giờ đây, chỉ với một câu, bạn có thể thao tác trên các tệp, hình ảnh, video, v.v. trong ổ đĩa trực tuyến của mình.
Đây là đĩa mạng Baidu "Cloud One", là trợ lý thông minh đám mây cá nhân đầu tiên của ngành công nghiệp và thậm chí trên thế giới. Hãy cùng cảm nhận "Cloud One" có thể giải quyết những vấn đề gì và mang đến những trải nghiệm mới?
Điểm đầu tiên là tìm hình ảnh hoặc video. Đôi khi, chúng ta nghĩ về một hình ảnh và muốn tìm nó trong đĩa mạng, thường sau nhiều bước, ném trong nửa ngày không thể tìm thấy. Bây giờ, bạn nói một từ với "Cloud One" và nó có thể giúp bạn xác định chính xác nó:
Chà, nó đã giúp tôi nhanh chóng tìm thấy những gì nhà khoa học trưởng LLYA của OpenAI đã phỏng vấn về máy biến áp.
Đằng sau tìm kiếm có vẻ đơn giản này là vai trò của nhiều khả năng AI, phải có khả năng hiểu nội dung video, xác định nhân vật và hình thành ký ức theo ngữ cảnh để định vị chính xác một khung hình nhất định của video, đây là một công nghệ rất hàng đầu trong lĩnh vực đám mây cá nhân toàn cầu.
Tính năng thứ hai của Yunyi là giúp người dùng hiểu nhanh nội dung video, hãy cùng tham khảo:
Bạn có thể thấy rằng hai khả năng được thể hiện, một là khả năng tóm tắt và tóm tắt nội dung, và khả năng trích xuất các câu vàng. Đây là cuộc phỏng vấn dài 43 phút, thông qua sự hiểu biết và khả năng logic của AI, Yun Yiduo đã tóm tắt và tinh chỉnh video, giới thiệu Llya và những ý tưởng chính của mình.
Nhưng nhiều khi, chúng ta sẽ cảm thấy rằng văn bản gốc rất thú vị, sau khi chắt lọc ý chính hoặc tóm tắt, nó không quá hấp dẫn, vì vậy chức năng thứ hai vừa rồi, tôi nghĩ nó thực sự hữu ích hơn với tôi, đó là chúng ta phải tìm phần thú vị nhất của video gốc, đó là những câu vàng. Ví dụ, LLYA nói rằng "học luật thống kê quan trọng hơn nhiều so với việc nhìn thấy vẻ bề ngoài". Bước đột phá quan trọng trong việc trích xuất câu vàng này là khai thác hiệu quả thông tin đa phương thức, là công nghệ hàng đầu thế giới. Nó có thể tìm thấy những phần tốt nhất từ nội dung phỏng vấn dài, giúp cải thiện đáng kể hiệu quả học tập và công việc của chúng tôi.
Đây là đĩa mạng mới sau khi tái tạo AI. Tính đến ngày hôm qua, Yunyi đã đạt 20 triệu người dùng.
Nó là một trợ lý thông minh AI dựa trên đám mây cá nhân. Trong thập kỷ qua, Baidu đã định nghĩa cái được gọi là đĩa mạng; Trong thập kỷ tới, Baidu sẽ sử dụng AI để xác định lại các đĩa mạng mới.
Tiếp theo, chúng ta hãy nhìn vào một sản phẩm lịch sử hơn, Baidu Map. **
Chúng tôi đã xây dựng lại sản phẩm 18 năm tuổi này với tư duy bản địa AI, đây cũng là sản phẩm bản đồ gốc AI đầu tiên trên thế giới.
Trong 18 năm qua, Baidu Maps đã tích lũy được rất nhiều chức năng, nó có thể điều hướng, gọi taxi, tìm tài xế thay thế, đặt khách sạn, mua vé và thậm chí đáp ứng nhu cầu tìm kiếm POI trong điều kiện phức tạp hơn. Trước đây, các hoạt động này rất phức tạp và thường yêu cầu sáu hoặc bảy bước trở lên để hoàn thành;
Giờ đây, chỉ cần người dùng nói nhu cầu, bản đồ có thể huy động hàng nghìn giao diện API dịch vụ và menu đa cấp trở thành phản hồi trực tiếp và nhanh chóng một bước.
Chúng ta hãy xem tiếp theo, Baidu Map được triển khai như thế nào?
Trong video, người dùng kiểm tra sự hiểu biết của Baidu Map về nhu cầu pan-demand, việc lựa chọn các điểm gặp gỡ trung gian, so sánh thông tin từ nhiều địa điểm, và đề xuất và đặt chỗ cho du lịch trong tương lai, và nó đưa ra các giải pháp hợp lý.
Điều này là do khả năng nói chuyện của Wen Xin, đã được hợp nhất với kiến thức POI cấp tỷ độc đáo của bản đồ và dữ liệu nhận thức lưu lượng truy cập hàng nghìn tỷ cấp, và có thể được gọi lên bất cứ lúc nào để đưa ra khuyến nghị. Bản đồ Baidu được xây dựng lại không chỉ là điều hướng, mà còn là hướng dẫn du lịch của chúng tôi. Bạn càng thông minh, bạn càng thông minh, bạn càng hiểu bạn nhiều hơn.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Toàn văn bài phát biểu là 11500 từ | Baidu Robin Li: Chúng ta sắp bước vào kỷ nguyên AI bản địa!
Nguồn bài viết: AI Dark Horse
Thế giới đã trở lại diện mạo trước đây, và một số người nói rằng Robin có một quảng cáo nghiêm túc trên sân khấu, tiết lộ cảm giác tương lai và sự tò mò của các sản phẩm công nghệ. Đó là niềm hy vọng và sự cộng hưởng của tương lai của công nghệ trong và ngoài sân khấu, của công ty và người dùng.
Đại hội Thế giới Baidu 2023 là hội nghị ra mắt chiến lược, công nghệ và sản phẩm quan trọng nhất của Baidu, được tổ chức trong 17 năm kể từ năm 2006.
**Ngày 17/10, con ngựa đen của doanh nhân được mời tham gia Hội nghị Thế giới Bạch Đô, ghi lại 10 nội dung quan trọng ngay tại chỗ, sắp xếp toàn bộ nội dung bài phát biểu của Robin Li và chia sẻ với mọi người. **
2.AI ứng dụng gốc là các ứng dụng được phát triển dựa trên khả năng hiểu, tạo, logic và bộ nhớ của các mô hình lớn. Những khả năng này không có sẵn trong các thời đại trước, do đó mở ra không gian không giới hạn cho sự đổi mới.
AI tạo ra và tìm kiếm là một trận đấu được tạo ra trên thiên đường. Tìm kiếm Baidu đã được xây dựng lại dựa trên mô hình lớn AI và tìm kiếm mới có ba đặc điểm: cực kỳ hài lòng, kích thích đề xuất và tương tác nhiều vòng. Nó không chỉ cải thiện chất lượng tìm kiếm mà còn phá vỡ phạm vi ứng dụng tìm kiếm và mở rộng ranh giới sản phẩm.
Baidu GBI là sản phẩm kinh doanh thông minh đầu tiên ở Trung Quốc, có thể rút ngắn công việc phân tích dữ liệu và viết báo cáo mà các nhà phân tích kinh doanh có thể hoàn thành trong hơn mười ngày xuống mức phút và là một công cụ ra quyết định dựa trên khả năng mô hình lớn.
Thư viện Baidu là sản phẩm toàn diện nhất của việc tái tạo AI. Baidu Wenku, dựa trên việc tái tạo mô hình lớn, đã được công bố, chuyển đổi từ "công cụ nội dung" sang "công cụ năng suất". Nó nhanh chóng phát triển trong các chức năng như hiểu tài liệu, viết bài, tạo thông minh PPT và chuyển đổi kiểu.
Đĩa mạng Baidu đã hoàn thành tái tạo AI. Trợ lý thông minh đám mây cá nhân "Cloud One" nhận ra sự chuyển đổi từ tương tác giao diện đồ họa sang tương tác ngôn ngữ tự nhiên, nâng cao hiểu biết thông tin đa phương thức và có thể định vị chính xác video, tóm tắt nội dung video chỉ bằng một cú nhấp chuột và tinh chỉnh các câu vàng, dẫn đầu thế giới.
Plug-in là một ứng dụng gốc AI đặc biệt, với ngưỡng thấp nhất và dễ sử dụng nhất. Trình cắm tăng cường khả năng của các mô hình lớn, làm cho chúng thực tế hơn và dễ sử dụng hơn, đồng thời làm cho nhiều dữ liệu riêng tư của doanh nghiệp có thể được sử dụng dễ dàng và nhanh chóng mà không có nguy cơ rò rỉ.
Các ứng dụng gốc AI trong tương lai phải đa phương thức và lái xe tự động là một ứng dụng điển hình của các mô hình lớn trực quan để tái tạo lại thế giới vật lý.
Baidu đang thúc đẩy mạnh mẽ sự tích hợp sâu sắc của công nghệ kỹ thuật số và nền kinh tế thực, và công nghệ mô hình lớn đã được áp dụng trong sản xuất, năng lượng, điện, công nghiệp hóa chất, giao thông vận tải và các ngành công nghiệp thực tế khác, sử dụng kiểm tra thông minh để giảm các mối nguy hiểm an toàn tiềm ẩn, sử dụng lập lịch thông minh để rút ngắn chu kỳ giao hàng, sử dụng ra quyết định thông minh để nâng cao hiệu quả doanh nghiệp, kiểm soát thông tin thông minh để giải quyết tắc nghẽn giao thông và mô hình lớn đang trở thành động lực quan trọng cho công nghiệp hóa mới.
Chúng ta sắp bước vào kỷ nguyên AI bản địa, kỷ nguyên tương tác giữa người và máy tính!
Xin chào quý khách! Chào mừng bạn đến với Đại hội Thế giới Baidu 2023!
Chào mừng bạn đến với kỷ nguyên của AI tạo ra! **
**Chủ đề của hội nghị này là các ứng dụng gốc AI. Tôi sẽ chia sẻ với bạn chi tiết kinh nghiệm của Baidu trong quá trình tái tạo bản địa AI của các dòng sản phẩm khác nhau của mình trong vài tháng qua và tôi hy vọng nó sẽ hữu ích cho bạn. **
Như chúng ta đã biết, các ứng dụng gốc AI được phát triển dựa trên các mô hình lớn. Sự đổi mới lớn nhất trong lĩnh vực công nghệ trong năm qua chắc chắn là sự xuất hiện của trí thông minh do các mô hình lớn mang lại, là nền tảng để phát triển các ứng dụng gốc AI.
Do đó, các ứng dụng gốc AI của Baidu cũng được phát triển dựa trên từ Wen Xin của chúng tôi. Những lời của Wen Xin được phát hành lần đầu tiên vào ngày 16 tháng 3 năm nay, và kể từ đó chúng tôi đã nhanh chóng lặp lại và được chấp thuận mở cửa ra thế giới vào ngày 31 tháng 8, thu được rất nhiều phản hồi của người dùng và tốc độ đổi mới đang tăng tốc.
Hôm nay, tôi vui mừng thông báo về việc phát hành chính thức của Wenxin Grand Model 4.0.
Chúng tôi cũng bắt đầu mời các bài kiểm tra cùng một lúc. Bạn bè tại hiện trường, bạn chỉ cần quét mã QR trên thẻ khách, nhận phiếu trải nghiệm và bạn có thể đăng nhập vào trang web chính thức của Wenxin Yiyan hoặc Ứng dụng Wenxin Yiyan để trải nghiệm Wenxin Model 4.0.
Đây là mô hình lớn Wenxin mạnh nhất cho đến nay, nó đã đạt được sự nâng cấp toàn diện về mô hình cơ bản, sự hiểu biết, thế hệ, logic và bộ nhớ bốn khả năng chính, so với phiên bản hiện tại của Wenxin Yiyan đã được cải thiện đáng kể, mức độ toàn diện không kém GPT4!
**Cái gọi là ứng dụng gốc AI, theo tôi hiểu, là một ứng dụng được phát triển dựa trên khả năng hiểu, tạo, logic và bộ nhớ của các mô hình lớn. Những khả năng này không có sẵn trong các thời đại trước, vì vậy chúng có thể mở ra không gian không giới hạn cho sự đổi mới. **
Dưới đây tôi sẽ kết hợp các kịch bản ứng dụng để giới thiệu cho bạn bốn khả năng trong lời nói của Wen Xin. Ứng dụng với bốn khả năng này là ứng dụng gốc của kỷ nguyên AI.
Trước đây, chúng ta đã nói AI là "khuyết tật trí tuệ nhân tạo", tức là AI thường không thể hiểu được lời nói của con người, và theo thời gian, bạn không dám nói chuyện với nó quá nhiều.
Hôm nay, mỗi từ bạn nói, rất có thể nó có thể hiểu, tốt hơn nhiều lần so với bạn bè và đồng nghiệp của bạn hiểu những gì bạn đang nói.
Ví dụ, bạn là một thanh niên làm việc tại Bắc Kinh muốn mua nhà ở Hà Bắc và muốn biết liệu bạn có thể đăng ký khoản vay quỹ dự phòng ở Bắc Kinh hay không.
Hãy nhập một dòng.
[Tôi muốn về Thừa Đức mua nhà, tôi có thể dùng vốn vay quỹ dự phòng không, làm thủ tục thì phải làm sao?] Tôi làm việc ở Bắc Kinh. 】
Chúng ta hãy xem kết quả. Wen Xin trả lời rằng anh ta có thể sử dụng khoản vay quỹ dự phòng. Tại sao phần Hỏi & Đáp này phản ánh khả năng hiểu mô hình lớn? Trên thực tế, những gì tôi đưa ra vừa rồi, có vẻ đơn giản, có một số cạm bẫy nhỏ để hiểu:
Trước hết, đó là một biểu hiện qua lại. Khi hầu hết mọi người gọi điện để đặt câu hỏi, họ nghĩ đến nơi để nói, không quá nghiêm ngặt, như thế này, đầu tiên tôi nói về việc mua nhà và xử lý quỹ dự phòng, và cuối cùng nói "Tôi làm việc ở Bắc Kinh", điều này đưa ra yêu cầu cao hơn về sự hiểu biết.
Thứ hai, tôi cố tình sử dụng hai cách diễn đạt mơ hồ ở đây. Một là "làm việc ở Bắc Kinh", ẩn ý là "gửi tiền quỹ dự phòng ở Bắc Kinh", hai là "trở về Thừa Đức mua nhà", chỉ là một từ "trả lại", trên thực tế, ngụ ý rằng tôi rất có thể là một hộ khẩu Thừa Đức.
Thứ ba, Wen Xin kết hợp bối cảnh và kết hợp tất cả các điểm thông tin lại với nhau để hiểu chính xác câu hỏi thực sự, đó là "người dùng có hộ khẩu ở Thừa Đức, tỉnh Hà Bắc, có thể sử dụng quỹ dự phòng của Bắc Kinh để mua nhà ở Thừa Đức bằng một khoản vay không", sau đó đưa ra câu trả lời và các bước xử lý cho câu hỏi này.
Có thể thấy rằng lời nói của Wen Xin, đã có thể hiểu khá chính xác về "cách diễn đạt không theo thứ tự, ý định biểu đạt tương đối mơ hồ và ẩn ý trong lời nói". Khả năng này có rất nhiều triển vọng ứng dụng trong các vấn đề của chính phủ, tiếp thị, dịch vụ khách hàng và các lĩnh vực khác.
Vậy làm thế nào để sử dụng sức mạnh thế hệ? Tôi yêu cầu Wen Xin tạo ra một bộ sáng tạo trong một từ.
Nhập một hình ảnh vào đó trước, sau đó nhập một đoạn văn.
[Đây là phương tiện năng lượng mới của Trường An.] Xin vui lòng giúp tôi tạo ra hai hình ảnh với một mùa xuân, phong cảnh sống động ở hậu cảnh, và cảm giác của chiếc xe tăng tốc. 】
Chúng ta thấy rằng thế hệ này sử dụng khung cảnh ngoài trời rực rỡ của mùa xuân, kèm theo sự mờ nhạt của việc tăng tốc.
Tôi đã yêu cầu nó tạo ra một poster dọc trực tiếp cho tôi.
[Kết hợp với thông tin của Changan Qiyuan trên trang web chính thức của Changan, làm một poster quảng cáo dọc và viết bản sao tiếp thị đơn giản và thanh lịch, lặp lại phong cách cơ thể. ] 】
Như bạn có thể thấy, chúng tôi đã tạo ra một áp phích quảng cáo dọc với cả hình ảnh và văn bản.
Bây giờ chúng tôi có một poster quảng cáo, và chúng tôi cần bản sao quảng cáo phong phú hơn, bạn có thể yêu cầu Wen Xin viết thêm vài từ:
[Chiếc xe này nhấn mạnh buồng lái thông minh kỹ thuật số, thiết kế Fuguang và lái xe chất lượng. Vui lòng viết thêm 5 phần bản sao quảng cáo, mỗi phần có tiêu đề ngắn và mô tả]
Việc viết quảng cáo được viết bởi AI, có vẻ đẹp của khoa học công nghệ, xu hướng của thời đại, cũng nhấn mạnh sự tương tác giữa con người và máy tính, việc viết quảng cáo chuyên nghiệp và mượt mà hơn, đã đạt đến tiêu chuẩn tiếp thị thương hiệu.
Vậy nếu tôi vẫn muốn có video thì sao?
[Vui lòng kết hợp thông tin trang web chính thức và nội dung video hiện có để tạo video bằng miệng kỹ thuật số của con người, tôi muốn chạy quảng cáo trong nguồn cấp dữ liệu.] 】
Nó đã được tạo, sau đó chúng tôi mở video để xem hiệu ứng.
Đây thực sự là một video phát sóng dân số kỹ thuật số đặc biệt hơn, và nó cũng phản ánh các đặc điểm của chiếc xe này.
Bây giờ, chúng tôi có 1 bộ phim thương mại, 5 bản quảng cáo và 1 poster, và tôi chỉ đưa cho Wen Xin một từ của một tài liệu hình ảnh và một vài từ như "xe thông minh kỹ thuật số" và "lái xe chất lượng", và toàn bộ quá trình chỉ mất chưa đầy 3 phút.
Cách đây không lâu, chúng tôi cũng đã sử dụng tính năng này để ra mắt nền tảng sáng tạo tiếp thị AIGC Steering Engine, cho phép một người trở thành nhóm tiếp thị AI. Có thể có một số người bạn copywriting trên hiện trường ngày hôm nay, nhìn thấy điều này, bạn có nghĩ rằng các mô hình lớn có thể mang lại nhiều cảm hứng sáng tạo hơn và giúp bạn nâng cao hiệu quả?
Nhiều người thường phải giúp con làm bài tập về nhà. Một số người nói đùa rằng "nếu bạn không viết bài tập về nhà, người mẹ là người hiếu thảo, và khi bạn viết bài tập về nhà, con gà bay và nhảy." Vậy hãy xem nào, liệu những lời của Wen Xin có thể giúp phụ huynh giải quyết vấn đề dạy kèm bài tập về nhà không?
Hãy để tôi tạo ra một vấn đề toán học và xem nó hoạt động như thế nào:
[Đống cát hình nón, diện tích đáy là 8 mét vuông, chiều cao là 12 decimet, trải đống cát này trên một con đường rộng 2 mét, dày 5 cm, có thể trải bao nhiêu mét? ] 】
Đây là một loại vấn đề toán học mà chúng ta có thể đã làm khi còn nhỏ, và đánh giá từ câu trả lời của Wen Xin, logic trả lời của nó khá rõ ràng. Mỗi bước được viết. Phụ huynh có thể xem nếu nó chi tiết hơn những gì được đưa ra trong một số tài liệu dạy kèm.
Thậm chí, AI có thể chỉ ra những điểm kiến thức được sử dụng trong việc giải quyết vấn đề để giúp trẻ củng cố việc học, hãy hỏi lại:
[Những điểm kiến thức nào liên quan đến quá trình giải quyết vấn đề trên?] 】
Wen Xin rõ ràng đã đưa ra các điểm kiến thức liên quan đến câu hỏi này, chẳng hạn như công thức thể tích hình nón, đơn vị đo lường thống nhất, thể tích không thay đổi và giải phương trình. Điều này rất thiết thực cho học sinh, giáo viên và phụ huynh. Sau khi những điểm kiến thức này được nắm vững rõ ràng, trẻ sẽ có khả năng rút ra suy luận từ nhau.
Khả năng siêu logic của mô hình lớn chắc chắn không chỉ có thể được sử dụng để giải quyết vấn đề. Lập kế hoạch tuyến đường cho bản đồ thông minh, trợ lý thông minh cho các tác vụ phức tạp, điều khiển đèn giao thông trong hệ thống giao thông thông minh, v.v. đều yêu cầu sử dụng khả năng logic.
Bộ nhớ ở đây chủ yếu đề cập đến những gì bạn đã nói trước đó, liệu AI có nhớ nó hay không, nội dung do AI tạo ra có mâu thuẫn hay không. Đây là một chỉ số quan trọng để phân biệt trí thông minh của các mô hình lớn và đối thoại nhiều vòng là hiện thân của khả năng ghi nhớ.
Tôi biết rằng nhiều nhà sáng tạo đang sử dụng Wen Xin để viết tiểu thuyết. Và nếu nội dung của cuốn tiểu thuyết không nhất quán, thì nó không thể đọc được. Hôm nay, tôi sẽ yêu cầu nó viết một cuốn tiểu thuyết ngay tại chỗ, xen kẽ một số phiền nhiễu với các câu hỏi và xem liệu nó có thể nhớ những gì nó đã viết không.
Tôi sẽ nhập một cái trước:
[Xin hãy giúp tôi viết một cuốn tiểu thuyết võ thuật, nhân vật chính là một người phụ nữ, và cốt truyện có những thăng trầm. ] 】
Chà, hãy xem, phác thảo của cuốn tiểu thuyết đã xuất hiện:
Đầu tiên là bối cảnh của câu chuyện, trong thế giới võ thuật cổ đại, thế lực hắc ám đang trỗi dậy; Tên của nữ chính là Ling'er, và cô ấy có sức mạnh để thao túng nội lực và bay.
Tôi sẽ nhập một cái trước:
[Xin hãy giúp tôi viết một cuốn tiểu thuyết võ thuật, nhân vật chính là một người phụ nữ, và cốt truyện có những thăng trầm. ] 】
Chà, hãy xem, phác thảo của cuốn tiểu thuyết đã xuất hiện:
Đầu tiên là bối cảnh của câu chuyện, trong thế giới võ thuật cổ đại, thế lực hắc ám đang trỗi dậy; Tên của nữ chính là Ling'er, và cô ấy có sức mạnh để thao túng nội lực và bay.
Tiếp theo, có phần đầu của câu chuyện. Ling'er muốn đánh bại thế lực hắc ám và cứu võ. Ở cao trào của cuốn tiểu thuyết, cô chiến đấu một trận chiến sinh tử với nhân vật phản diện, đánh bại nhân vật phản diện, và cứu võ thuật và tất cả các giáo phái.
Cuối cùng, Linh Nhi và đồng minh cũng cùng nhau thành lập Học viện Tu luyện Nội lực.
Bây giờ câu chuyện về cơ bản đã được hình thành, nhưng nó hơi đơn giản, tôi muốn thêm một số yêu cầu về nhân vật:
[Bây giờ mối quan hệ nhân vật quá đơn giản, chỉ có hai nhân vật, và thêm 4 ký tự nữa]
Wen Xin đã giao thêm bốn vai diễn trong một từ, mỗi vai có một thân phận và tính cách khác nhau, với một tính cách khác nhau, Murong Gucheng này là một thế hệ chưởng môn, và có một nhà tiên tri Xiao Hanyan có thể dự đoán tương lai.
Nhưng bây giờ vẫn còn một yếu tố cần thiết trong tiểu thuyết, xung đột kịch tính. Một câu chuyện không có xung đột thì không phải là một câu chuyện hay, và quá trình nữ chính đánh bại thế lực hắc ám vừa rồi quá đơn giản, hãy xem liệu chúng ta có thể làm cho nó khó khăn hơn không.
Nhập một cái khác
[Cũng cần thêm xung đột kịch tính của dòng chính vào câu chuyện để câu chuyện dễ xem hơn]
Chúng ta thấy, nó đã được viết cho xung đột kịch tính. Đây là một sự đảo ngược, đằng sau thế lực hắc ám, thủ lĩnh thực sự là một nhân vật cấp đại kiện tướng rất được kính trọng, điều này đã khiến nữ chính gặp nguy hiểm nhiều lần. Cho đến trận chiến quyết định, nữ chính đã có cơ hội chống trả.
Như bạn có thể thấy, nó nhớ rằng dòng chính của câu chuyện là cuộc đối đầu giữa Ling'er và thế lực hắc ám, và xung đột cũng xoay quanh dòng chính này.
Vậy, Wen Xin có còn nhớ câu chuyện anh vừa viết, và tương quan những nhân vật này với câu chuyện không?
Hãy đưa ra một yêu cầu nữa:
[Đưa những nhân vật này vào phác thảo của câu chuyện mà bạn đã thiết kế cho tôi, và thiết kế một tiêu đề.] 】
Kết quả đã được chiếu trên màn ảnh rộng, và cuốn tiểu thuyết được gọi là "Trận chiến chính nghĩa của sông hồ", bổ sung thêm các nhân vật bổ sung và xung đột kịch tính vào phác thảo câu chuyện. Chương thứ tư và thứ năm ở đây cũng cho chúng ta biết rằng đại sư của nhân vật phản diện này là Tống Cổ Thành vừa được giới thiệu.
Trong toàn bộ quá trình, tôi liên tục tăng độ khó và đưa ra các yêu cầu mới để can thiệp vào bộ nhớ của nó, và Wen Xin vẫn nhớ tất cả các nhu cầu và câu trả lời trước đó, và có thể tương ứng chính xác cốt truyện và nhân vật, và trí nhớ của anh ấy rất tuyệt vời.
Rồi tất cả mọi người ở hiện trường thử nghiệm bây giờ, các bạn có nhớ, khả năng đặc biệt của nhân vật chính Linger là gì?
Có lẽ hầu hết mọi người không nhớ, vì vậy hãy xem Wen Xin có nhớ không?
[Khả năng của nữ chính là gì?] 】
Vâng, câu trả lời đã được đưa ra, đó là sức mạnh để thao túng nội lực và bay. Đây là văn bản ví dụ được viết bởi Wen Xin trong vòng đối thoại đầu tiên. Bây giờ, sau năm vòng đối thoại và vài ngàn từ hư cấu, nó vẫn có thể nhớ những gì nó đã viết trước đó, đó là khả năng ghi nhớ của mô hình lớn.
Ví dụ, để tạo ra một bản sao quảng cáo, nó cần hiểu chủ đề sáng tạo, làm rõ logic của sáng tạo và duy trì tính nhất quán thông qua bộ nhớ.
Trong giải quyết vấn đề, cũng cần vận dụng toàn diện khả năng hiểu, sáng tạo, logic và ghi nhớ.
Hãy xem xét một ví dụ ứng dụng toàn diện:
Trước hết, chúng tôi mở Ứng dụng Baidu được xây dựng lại, quét hộp thuốc do bệnh nhân lấy ra bằng máy ảnh và không cần phải xem qua các hướng dẫn bằng chữ in nhỏ và bác sĩ kỹ thuật số sẽ giúp bạn giải thích.
Những câu hỏi xuất hiện trên màn hình vừa rồi như "nên ăn trước hay sau bữa ăn", "uống rượu có ăn được không", "còn những biện pháp phòng ngừa nào khác" đang được nhiều bệnh nhân dùng thuốc hàng ngày sẽ gặp phải vấn đề.
Chúng tôi thấy rằng mô hình lớn không chỉ có thể giúp bệnh nhân giải thích các hướng dẫn về thuốc mà còn kết hợp các nhu cầu được cá nhân hóa để nâng cao hiệu quả của thuốc và đảm bảo tính chính xác và kịp thời của thuốc của bệnh nhân.
Cách đây không lâu, chúng tôi đã kết hợp mô hình Wen Xin với kiến thức y học chuyên môn và phát hành Mô hình lớn Spirit Medicine, có thể giúp bệnh nhân và bác sĩ nói chuyện và tạo hồ sơ y tế bằng cách áp dụng Bot Spirit Medicine. Ví dụ này không chỉ sử dụng khả năng hiểu và tạo ra bộ nhớ logic mà còn cả khả năng nói đa phương thức, tầm nhìn, v.v.
Cuộc trình diễn trước đó chủ yếu phản ánh sự tiến bộ của mô hình Wenxin trong bốn khả năng hiểu, thế hệ, logic và bộ nhớ, là cơ sở cho sự tồn tại của tất cả các ứng dụng gốc AI. Tương tự, nếu không có một hệ sinh thái ứng dụng gốc AI phong phú được xây dựng trên mô hình cơ bản, một mô hình lớn là vô giá trị.
Tiếp theo, tôi sẽ cho bạn thấy những sản phẩm này được xây dựng lại với các mô hình lớn trông như thế nào? Điều này cũng nhằm mở rộng trí tưởng tượng của mọi người và truyền cảm hứng cho mọi người tạo ra các ứng dụng gốc AI tuyệt vời hơn.
Baidu tìm kiếm mới, khi mở giao diện, ngoài việc nhìn thấy hộp tìm kiếm, kết quả tìm kiếm sẽ hoàn toàn khác so với trước đây.
** Tìm kiếm mới được xây dựng lại có ba đặc điểm: cực kỳ hài lòng, kích thích đề xuất và nhiều vòng tương tác. **
Sự hài lòng cuối cùng là gì? Khi bạn nhập câu hỏi vào hộp tìm kiếm, chẳng hạn như "MBTI là gì?" "Làm thế nào để đậu xe bên cạnh", tìm kiếm mới không còn là cung cấp cho bạn một loạt các liên kết, mà là để hiểu thông qua mô hình lớn và tạo ra câu trả lời tốt nhất
Ví dụ: nếu bạn hỏi "xếp hạng giá trị gia tăng công nghiệp theo quốc gia trong 20 năm qua", tìm kiếm mới sẽ không chỉ cho bạn câu trả lời trực tiếp mà còn hiển thị câu trả lời bằng biểu đồ động.
Từ màn hình lớn phía sau tôi, tôi có thể thấy rằng trong hai thập kỷ qua, ngành công nghiệp sản xuất công nghiệp của chúng ta đã trải qua sự phát triển nhanh chóng và đang chuyển đổi từ một quốc gia sản xuất sang một cường quốc sản xuất.
Đây là sự hài lòng cuối cùng: một bước để cung cấp cho bạn câu trả lời cuối cùng.
Vì vậy, bước thứ hai, sau khi nhìn thấy câu trả lời, bạn còn muốn thấy gì nữa?
Đây là nơi kích thích khuyến nghị được sử dụng. Ví dụ, sau biểu đồ động, hàm kích thích khuyến nghị cũng đưa ra "mối quan hệ giữa giá trị gia tăng công nghiệp và GDP là gì" và "tác động của ngành công nghiệp đối với sự phát triển của nền kinh tế quốc gia" những câu hỏi này bạn cũng có thể quan tâm. Nhấp để nhận câu trả lời.
Tất nhiên, không phải tất cả các nhu cầu đều có một câu trả lời đúng duy nhất. Nhu cầu của người dùng đôi khi có thể phức tạp và không rõ ràng trong một hoặc hai câu. Người dùng cũng khó thể hiện đầy đủ một yêu cầu rất phức tạp thông qua một mô tả lớn cùng một lúc.
Lúc này, chúng ta cần sử dụng một mô hình tìm kiếm mới lạ và cá nhân hóa hơn để phục vụ người dùng, đó là: tương tác nhiều vòng.
Chúng ta hãy xem ví dụ này:
Ví dụ: nếu bạn hỏi "đâu là địa điểm được đề xuất để leo núi quanh Bắc Kinh", nó sẽ đưa ra nhiều câu trả lời như núi Baihua và núi Haituo, thiên về các tuyến đường đi bộ đường dài;
Sau đó, nó đưa ra một số gợi ý để bổ sung cho sự lựa chọn tình huống của bạn, bạn có thể chọn giữa người mới bắt đầu, cha mẹ-con cái và xem lá rụng. Bây giờ, nó đã thay đổi để giới thiệu Núi Tây và Núi Baiwang, tương đối dễ leo lên và thân thiện hơn với các hoạt động của cha mẹ và con cái.
Sau đó tiếp tục hỏi, bạn cần thiết bị gì để leo núi và đi bộ đường dài? Câu trả lời là cột trekking, giày đi bộ đường dài, v.v., và nó cũng nhớ rằng nó đã chọn một tour du lịch cha mẹ và con cái sớm hơn, và đặc biệt là đưa ra lời khuyên về cách chăm sóc trẻ em.
Tìm kiếm tuy vẫn bắt đầu từ ô đơn giản đó, nhưng từng bước tiếp theo, đã vượt qua và xây dựng lại chế độ tìm kiếm ban đầu, không chỉ nâng cao chất lượng tìm kiếm mà còn đột phá phạm vi ứng dụng tìm kiếm và mở rộng ranh giới sản phẩm. như vậy
Tìm kiếm tương tác AI sẽ dẫn dắt sự chuyển đổi thế hệ của ngành công nghiệp tìm kiếm.
Trong tương lai gần, tìm kiếm sẽ trở thành một trợ lý thân mật, có thể gợi mở, giải quyết vấn đề và thậm chí phá vỡ giới hạn của "kết thúc" bất cứ lúc nào, để đáp ứng mọi lúc, mọi nơi, đáp ứng nhu cầu và đồng hành cùng toàn bộ quá trình.
Tiếp theo, chúng ta hãy xem xét sản phẩm tư duy gốc AI thứ hai, Baidu GBI, Generative Business Intelligence, tức là trí tuệ kinh doanh tổng quát. **
Đây là một sản phẩm từ đầu, không phải là tái cấu trúc của một sản phẩm hiện có. **
Trong thế giới kinh doanh của chúng ta, không thể tách rời nhất là phân tích kinh doanh, tức là BI, làm thế nào để đưa ra quyết định kinh doanh nhanh nhất? Trước tiên chúng ta hãy cảm nhận qua một video:
Như bạn có thể thấy, trong video, tổng thống đã hỏi nhiều câu hỏi chuyên môn. Có phân tích tài chính, phân phối dự án và phân tích người dùng, và trợ lý cho chủ tịch GBI có thể nhanh chóng đưa ra kết quả và để chủ tịch đưa ra quyết định ngay tại chỗ.
Không chỉ con người với các công cụ tiên tiến sẽ không bị thay thế bởi AI, mà "thăng chức và tăng lương không phải là một giấc mơ". Những người không sử dụng các công cụ tiên tiến có nguy cơ mất việc. **
Vậy, Baidu GBI đã đi trước một bước như thế nào? Nó phá vỡ phân tích dữ liệu truyền thống theo ba cách:
Trước hết, BI truyền thống chỉ có thể được vận hành bởi các chuyên gia, trong khi GBI có thể trực tiếp hiểu các câu hỏi của tổng thống và thực hiện chúng trong thời gian thực;
Thứ hai, GBI cung cấp một phương thức truy cập thuận tiện, doanh nghiệp có thể truy cập dữ liệu, đặt câu hỏi và phân tích bất kỳ dữ liệu nào bằng ngôn ngữ tự nhiên và không còn cần phải thực hiện thủ công các thao tác chuyên môn khác nhau trên cơ sở dữ liệu và bảng;
Thứ ba, GBI cũng có khả năng học hỏi và các công ty có thể đưa chuyên môn ngành của mình vào để trở thành chuyên gia trong ngành.
Đây là Baidu GBI, có thể rút ngắn công việc phân tích dữ liệu và viết báo cáo mà các nhà phân tích kinh doanh có thể hoàn thành trong hàng chục ngày xuống mức phút. Cái gọi là võ công của thế giới chỉ có thể bị phá vỡ nhanh chóng;
** Doanh nghiệp cạnh tranh, không phải cá lớn ăn cá nhỏ, nhưng cá nhanh ăn cá chậm, ra quyết định nhanh hơn đối thủ, rất có khả năng bạn sẽ thắng! **
Ngày nay, nó đã trở thành một siêu trợ lý mà người Baidu không thể thiếu được.
Bây giờ mọi người hãy xem, điều này giống như một luồng thực hiện ghi âm thời gian thực. Hãy xem liệu nó có thể nhớ tất cả các điểm vừa đề cập hay không:
Đây là chức năng tạo một cú nhấp chuột của biên bản cuộc họp. Chúng tôi nói rằng làm thế nào để tiến hành các cuộc họp hiệu quả là một công việc kỹ thuật. Tính năng này giúp giảm đáng kể khối lượng công việc của cuộc họp và rút ngắn 40% thời gian họp.
Một kịch bản phổ biến khác là các nhóm làm việc. Hầu hết mọi người ở nơi làm việc thường bị tấn công bởi các tin nhắn trò chuyện nhóm khác nhau. Sau đó, nhanh chóng tóm tắt những điểm chính của cuộc trò chuyện nhóm trở thành một tính năng vô cùng hữu ích.
Chúng ta hãy xem cách các nhà quản lý sản phẩm của chúng tôi sử dụng nó.
Anh ta có 9 nhóm làm việc, trì hoãn trong một khoảng thời gian, có thể có hơn một nghìn thông tin chưa đọc và Ruliu không chỉ có thể "1000 tin nhắn, lấy nét trong một giây", mà còn chia nội dung cần đọc thành nhiều loại: "chờ tôi xác nhận", "tập trung vào", "thảo luận chủ đề", giúp cải thiện đáng kể hiệu quả công việc.
Vì vậy, nó được tinh chỉnh chính xác, nó sẽ bị hiểu lầm, hoặc nó sẽ bỏ lỡ thông tin quan trọng? Điều này kiểm tra khả năng hiểu và tạo ra các mô hình lớn. Hiểu càng sâu, tóm tắt càng chính xác. Đừng nói 1.000, 10.000 mẩu thông tin, chẳng hạn như siêu trợ lý dòng chảy cũng có thể đưa ra phân loại thông minh và tóm tắt thông minh trong vài giây.
Vé máy bay, khách sạn, đàm phán, v.v., những nhiệm vụ giao dịch này rất tẻ nhạt và tốn thời gian! Nếu bạn có một trợ lý AI để giúp bạn giải quyết các nhiệm vụ tầm thường, bạn có muốn làm việc nhiều hơn không?
Ví dụ, gần đây, giám đốc sản phẩm của Ruliu đã lên kế hoạch đến Thượng Hải để gặp ông Wang của PICC. Chúng tôi biết rằng PICC đang thúc đẩy sự đổi mới trong các sản phẩm và dịch vụ, mô hình kinh doanh, công nghệ kỹ thuật số và các khía cạnh khác, và công nghệ trí tuệ nhân tạo của chúng tôi tại Baidu có thể đóng một vai trò.
Hành trình chuyến công tác này có thể được bàn giao cho Ruliu, siêu trợ lý, và chúng ta hãy xem hiệu suất của nó.
Siêu trợ lý có thể sắp xếp chuyến đi dựa trên thông tin lịch trình của mình.
Giống như cuộc họp mới nhất kết thúc lúc 4 giờ, vì vậy hãy đặt chuyến bay sau 7:30; Và, theo tiêu chuẩn du lịch của anh ấy, giúp anh ấy tìm khách sạn nơi anh ấy có thể ở. Cuối cùng, một lời mời cho khách hàng đã được đưa ra.
Anh ta có thể cần một số nền tảng trước khi gặp khách hàng, và một siêu trợ lý cũng có thể giúp anh ta điều này. Thông qua kết nối với CRM và các dữ liệu hệ thống khác của công ty, chẳng hạn như luồng cung cấp dữ liệu chi tiết như các dự án hợp tác và hồ sơ truy cập.
Bằng cách hiểu tình hình hợp tác kinh doanh và thông tin bên ngoài, chẳng hạn như dòng chảy cũng có thể giúp anh ta tạo ra một tài liệu tham khảo thảo luận, đặt trước các câu hỏi mà khách hàng có thể hỏi và đưa ra một số đề xuất hợp tác. Từ quan điểm này, Ruliu có giống một trợ lý thực sự hơn không?
Chỉ cần ba chữ, Ruliu đã hoàn thành việc đặt phiếu du lịch, rượu máy và lịch trình, thậm chí còn chuẩn bị tài liệu tham khảo để thương lượng, đó chính là "du lịch một cú nhấp chuột" của Ruliu. Làm thế nào để nó làm điều đó?
Đây là một ứng dụng toàn diện về khả năng hiểu, tạo, logic và ghi nhớ của một mô hình lớn, tự động tháo rời các tác vụ phức tạp thành nhiều tác vụ đơn giản để thực hiện riêng biệt, sau đó hợp nhất để tạo ra kết quả cuối cùng. Chúng tôi nói rằng nâng cao hiệu quả có nghĩa là nâng cao khả năng cạnh tranh, chẳng hạn như để "công việc thông minh" thay thế "làm việc chăm chỉ".
Thư viện Baidu sẽ thay đổi hoàn toàn thói quen làm việc, học tập và sáng tạo của chúng ta.
Chúng tôi đã tạo ra như thế nào trong quá khứ? Ví dụ: giả sử bạn đang thuyết trình về ứng dụng AI trong tâm lý học. Phải mất vài ngày để kiểm tra thông tin, phân loại tài liệu, viết bản thảo, viết PPT và làm đẹp PPT.
Hôm nay, trên Baidu Wenko, bạn có thể bắt đầu làm việc với một câu, nhìn vào màn hình lớn: Đầu tiên, bạn muốn nó viết một bài phát biểu và nó tìm thấy hàng tá tài liệu về chủ đề trí tuệ nhân tạo và tâm lý học.
Nó cũng có thể xác định đâu là tạp chí học thuật, báo cáo có thẩm quyền và đâu chỉ là tài liệu đại chúng. Nếu bạn muốn viết một bài báo sống động, hãy chọn một số tài liệu phổ biến, chẳng hạn như bài tiểu luận và khoa học phổ biến.
Sau đó, nếu bạn muốn có một bài phát biểu học thuật nghiêm ngặt, bạn chỉ có thể kiểm tra nội dung có thẩm quyền để đảm bảo tính chính xác của nội dung. Sau đó, bằng cách hiểu các bản thảo này, thư viện tạo ra một bài viết có cấu trúc tốt và được xác định rõ, đồng thời đánh bóng và định dạng nội dung.
Điều này có thể được thực hiện bởi vì Baidu Wenku đã có 1 tỷ tài liệu chất lượng cao, dựa trên sự hiểu biết về những nội dung này, viết những tài liệu thực sự thiết thực và rõ ràng, chứ không phải là những điều vô nghĩa nghiêm trọng như nhiều mô hình lớn, cũng không phải là nói suông chung chung.
Tiếp theo, bài thuyết trình cũng cần PPT. Thư viện có thể kết hợp bản thảo vừa rồi với một số tài liệu bạn đã thu thập được để tự động tạo khuôn khổ của PPT, sau đó làm đẹp bản vẽ để tạo PPT gồm hàng chục trang.
Ngoài ra còn có một số trò chơi với khả năng tạo đa phương thức, chẳng hạn như lựa chọn phong cách và chuyển đổi kiểu bằng một cú nhấp chuột. Nhưng có một số nơi kiểm tra khả năng của thư viện nhiều hơn và đòi hỏi nó phải có sự hiểu biết chính xác về nội dung. Ví dụ, nó cần biết mối quan hệ giữa các ý tưởng, cho dù chúng nằm cạnh nhau hay phụ thuộc, để thiết kế biểu đồ chính xác.
Do khả năng hiểu này, thư viện cũng có thể viết kịch bản giọng nói tương ứng cho PPT này trên cơ sở tạo PPT. Không chỉ vậy, nó còn có thể sử dụng những nội dung này để suy luận những câu hỏi mà khán giả có thể hỏi và chuẩn bị cho bạn câu trả lời.
Chúng tôi đã đánh giá rằng khả năng tạo ra các thư viện, đặc biệt là PPT, vượt xa bất kỳ công cụ nào khác trên thị trường, dù là nước ngoài hay trong nước. Trước đây, mọi người đến thư viện để tìm nội dung làm sẵn. Trong tương lai, mọi người sẽ có thể sản xuất nội dung theo ý muốn, hiệu quả hơn bất kỳ công cụ năng suất nào khác.
Cách đây không lâu, vào ngày đầu tiên của phiên bản mới của Baidu Wenku, chức năng AI mới đã mở ra hơn 2 triệu trải nghiệm. Bây giờ, chúng tôi tự tin hơn để nói rằng trong thời đại của các mô hình lớn, Baidu Wenku là điểm khởi đầu tốt nhất để sản xuất nội dung.
Theo hướng tái thiết AI, đĩa mạng Baidu tập trung làm tốt công việc trong các dịch vụ thông minh cho các tệp cá nhân.
Những gì bạn thấy bây giờ là trang chủ mới của đĩa mạng Baidu.
** Đĩa mạng được xây dựng lại không chỉ nhận ra sự chuyển đổi từ tương tác giao diện đồ họa sang tương tác ngôn ngữ tự nhiên mà còn tăng cường hiểu biết thông tin đa phương thức. **
Giờ đây, chỉ với một câu, bạn có thể thao tác trên các tệp, hình ảnh, video, v.v. trong ổ đĩa trực tuyến của mình.
Điểm đầu tiên là tìm hình ảnh hoặc video. Đôi khi, chúng ta nghĩ về một hình ảnh và muốn tìm nó trong đĩa mạng, thường sau nhiều bước, ném trong nửa ngày không thể tìm thấy. Bây giờ, bạn nói một từ với "Cloud One" và nó có thể giúp bạn xác định chính xác nó:
Chà, nó đã giúp tôi nhanh chóng tìm thấy những gì nhà khoa học trưởng LLYA của OpenAI đã phỏng vấn về máy biến áp.
Đằng sau tìm kiếm có vẻ đơn giản này là vai trò của nhiều khả năng AI, phải có khả năng hiểu nội dung video, xác định nhân vật và hình thành ký ức theo ngữ cảnh để định vị chính xác một khung hình nhất định của video, đây là một công nghệ rất hàng đầu trong lĩnh vực đám mây cá nhân toàn cầu.
Tính năng thứ hai của Yunyi là giúp người dùng hiểu nhanh nội dung video, hãy cùng tham khảo:
Bạn có thể thấy rằng hai khả năng được thể hiện, một là khả năng tóm tắt và tóm tắt nội dung, và khả năng trích xuất các câu vàng. Đây là cuộc phỏng vấn dài 43 phút, thông qua sự hiểu biết và khả năng logic của AI, Yun Yiduo đã tóm tắt và tinh chỉnh video, giới thiệu Llya và những ý tưởng chính của mình.
Nhưng nhiều khi, chúng ta sẽ cảm thấy rằng văn bản gốc rất thú vị, sau khi chắt lọc ý chính hoặc tóm tắt, nó không quá hấp dẫn, vì vậy chức năng thứ hai vừa rồi, tôi nghĩ nó thực sự hữu ích hơn với tôi, đó là chúng ta phải tìm phần thú vị nhất của video gốc, đó là những câu vàng. Ví dụ, LLYA nói rằng "học luật thống kê quan trọng hơn nhiều so với việc nhìn thấy vẻ bề ngoài". Bước đột phá quan trọng trong việc trích xuất câu vàng này là khai thác hiệu quả thông tin đa phương thức, là công nghệ hàng đầu thế giới. Nó có thể tìm thấy những phần tốt nhất từ nội dung phỏng vấn dài, giúp cải thiện đáng kể hiệu quả học tập và công việc của chúng tôi.
Đây là đĩa mạng mới sau khi tái tạo AI. Tính đến ngày hôm qua, Yunyi đã đạt 20 triệu người dùng.
Nó là một trợ lý thông minh AI dựa trên đám mây cá nhân. Trong thập kỷ qua, Baidu đã định nghĩa cái được gọi là đĩa mạng; Trong thập kỷ tới, Baidu sẽ sử dụng AI để xác định lại các đĩa mạng mới.
Chúng tôi đã xây dựng lại sản phẩm 18 năm tuổi này với tư duy bản địa AI, đây cũng là sản phẩm bản đồ gốc AI đầu tiên trên thế giới.
Trong 18 năm qua, Baidu Maps đã tích lũy được rất nhiều chức năng, nó có thể điều hướng, gọi taxi, tìm tài xế thay thế, đặt khách sạn, mua vé và thậm chí đáp ứng nhu cầu tìm kiếm POI trong điều kiện phức tạp hơn. Trước đây, các hoạt động này rất phức tạp và thường yêu cầu sáu hoặc bảy bước trở lên để hoàn thành;
Giờ đây, chỉ cần người dùng nói nhu cầu, bản đồ có thể huy động hàng nghìn giao diện API dịch vụ và menu đa cấp trở thành phản hồi trực tiếp và nhanh chóng một bước.
Chúng ta hãy xem tiếp theo, Baidu Map được triển khai như thế nào?
Trong video, người dùng kiểm tra sự hiểu biết của Baidu Map về nhu cầu pan-demand, việc lựa chọn các điểm gặp gỡ trung gian, so sánh thông tin từ nhiều địa điểm, và đề xuất và đặt chỗ cho du lịch trong tương lai, và nó đưa ra các giải pháp hợp lý.