Hội nghị nhà phát triển đầu tiên của OpenAI: GPT-4 Turbo, GPT Store

2023-11-07 00:35:50

Nguồn: Có một Newin mới

Tại buổi ra mắt ngày phát triển đầu tiên của OpenAI, Sam Altman đã trình bày chi tiết về một loạt các phát triển quan trọng cho công ty, không giới hạn ở GPT-4 Turbo, một mô hình mới có nhiều sức mạnh hơn, bối cảnh dài hơn và kiểm soát nhiều hơn, cũng như ra mắt API hỗ trợ để đơn giản hóa trải nghiệm cho các nhà phát triển để xây dựng các tác nhân hỗ trợ, OpenAI nhấn mạnh rằng ngôn ngữ tự nhiên sẽ là một cách quan trọng để tương tác với máy tính trong tương lai và cũng giới thiệu lập trình GPT thông qua hội thoại Altman đã công bố sự ra mắt sắp tới của GPT Store, cho phép người dùng chia sẻ và khám phá các ứng dụng GPT sáng tạo và cung cấp các ưu đãi chia sẻ doanh thu. Altman cũng nói về việc tăng cường hợp tác với Microsoft, giới thiệu mô hình chuyển văn bản thành giọng nói mới và các cuộc gọi tính năng được cải thiện, có thể được tóm tắt trong các phiên sau:

GPT-4 Turbo: Các mô hình mới đã được đưa ra, với độ dài ngữ cảnh tăng lên và điều khiển chính xác hơn.

API hỗ trợ: Cung cấp quy trình đơn giản hóa cho các nhà phát triển để tạo tác nhân phụ.
Lập trình ngôn ngữ tự nhiên: Chỉ ra cách tạo GPT thông qua các cuộc hội thoại.
GPT Store: Cho phép người dùng chia sẻ và khám phá các ứng dụng GPT và cung cấp chia sẻ doanh thu cho người sáng tạo.
Microsoft Collaboration: Giới thiệu một mô hình chuyển văn bản thành giọng nói mới, cũng như bài phát biểu của Giám đốc điều hành Microsoft Satya Nadella.
Cảm ơn nhóm: Altman bày tỏ lòng biết ơn đối với nhóm OpenAI vì công việc của họ.
Tech Showcase: Các tính năng mới đã được giới thiệu, bao gồm bản demo cho các ứng dụng du lịch và trợ lý kích hoạt bằng giọng nói.

Dưới đây là tất cả nội dung đầy đủ từ ngày phát triển đầu tiên của OpenAI:

Đầu tiên, Altman nhớ lại bản phát hành ngày 30 tháng 11 của ChatGPT như một bản xem trước nghiên cứu quan trọng và tự hào thông báo sự ra mắt của GPT-4 vào tháng 3, mô hình mạnh nhất trên thế giới hiện nay.

Altman cũng giới thiệu khả năng nói và hình ảnh được giới thiệu cho ChatGPT trong vài tháng qua, mang lại cho nó khả năng nhìn, nghe và nói, và thông báo rằng DALL · Sự ra mắt của E 3, mẫu hình ảnh tiên tiến nhất thế giới và đã được tích hợp vào ChatGPT.

Đối với khách hàng cấp doanh nghiệp, OpenAI đã ra mắt ChatGPT Enterprise, cung cấp khả năng truy cập GPT nhanh hơn, thời gian ngữ cảnh dài hơn và bảo vệ quyền riêng tư và bảo mật cấp doanh nghiệp nhiều hơn. Altman tiết lộ rằng khoảng 2 triệu nhà phát triển đang sử dụng API của họ, hơn 92% các công ty trong danh sách Fortune 500 đang xây dựng các giải pháp dựa trên sản phẩm của họ và ChatGPT hiện có khoảng 100 triệu người dùng hoạt động hàng tuần. Đặc biệt, ông lưu ý rằng thành tích này hoàn toàn dựa vào truyền miệng, vì người dùng thấy sản phẩm hữu ích và giới thiệu nó cho bạn bè. Ông kết luận bằng cách lưu ý rằng trong khi dữ liệu rất ấn tượng, điều quan trọng hơn là cách mọi người sử dụng các sản phẩm này và cách họ tận dụng AI, sau đó chiếu một video trực quan hóa những tiến bộ này.

Tại hội nghị nhà phát triển của OpenAI, Sam Altman đã cho chúng ta thấy AI có thể tác động sâu sắc đến cuộc sống cá nhân và sự sáng tạo của mọi người như thế nào trong một video. Một trong những trường hợp trong video kể về một người đàn ông sử dụng ChatGPT theo cách không lãng mạn, nhưng tôn trọng và trìu mến, để nói với cha mình tình yêu và sự ủng hộ bằng ngôn ngữ mẹ đẻ của cha mình - Tagalog - và một cấu trúc ngữ pháp phức tạp. Trường hợp này thể hiện khả năng hiểu và áp dụng các sắc thái văn hóa, ngôn ngữ của ChatGPT.

Theo Altman, các ứng dụng sáng tạo của ChatGPT rất tuyệt vời và có thể giúp người sáng tạo mở rộng tư duy và tăng cường sự tự tin của họ. Một ví dụ là ai đó sử dụng ChatGPT để hỗ trợ họ trong các công việc hàng ngày như kiểm tra những gì còn thiếu trong tủ lạnh, lên kế hoạch cho một công thức nấu ăn chay hoặc thậm chí giúp tạo bảng tính và viết mã, và nhân vật trong một video khác phát hiện ra mối quan hệ, sự kiên nhẫn, kiến thức và khả năng phản hồi của ChatGPT. Đối với một học sinh 4.0 và là mẹ của bốn đứa con, khả năng cung cấp câu trả lời cho các câu hỏi và giải thích của ChatGPT giúp cô giảm sự phụ thuộc vào gia sư và giúp cô có nhiều thời gian hơn cho gia đình và bản thân. Cuối cùng, cũng có một người đàn ông trong video kể về việc anh ta bị giới hạn sử dụng tay trái sau khi trải qua phẫu thuật tủy sống và não. Giờ đây, bằng cách sử dụng các tính năng nhập liệu bằng giọng nói và đàm thoại của ChatGPT, người dùng này đã được hỗ trợ và tạo điều kiện rất nhiều. Những câu chuyện điển hình này minh họa tiềm năng của ChatGPT trong việc giúp đỡ cuộc sống hàng ngày, hỗ trợ học tập và vượt qua những trở ngại, đồng thời chứng minh cách AI có thể kết nối và trao quyền cho người dùng trên quy mô toàn cầu hơn bao giờ hết.

Sam Altman sau đó đã chia sẻ cách mọi người đang tận dụng công nghệ của họ và nhấn mạnh rằng đó chính xác là những gì họ làm. Sau đó, ông công bố một loạt các phát triển mới. Altman nói rằng họ đã dành rất nhiều thời gian để nói chuyện với các nhà phát triển trên khắp thế giới và lắng nghe phản hồi của họ, điều này đã có tác động sâu sắc đến những gì chúng tôi sẽ trình bày ngày hôm nay.

OpenAI đã ra mắt một mô hình mới, GPT-4 Turbo. Mô hình mới này sẽ giải quyết nhu cầu của nhiều nhà phát triển. Ông đã trình bày chi tiết sáu cập nhật lớn: đầu tiên là độ dài ngữ cảnh, GPT-4 hỗ trợ ngữ cảnh lên tới 8.000 mã thông báo và trong một số trường hợp có thể đạt tới 32.000. GPT-4 Turbo hỗ trợ ngữ cảnh lên tới 128.000 token, tương đương với 300 trang của một cuốn sách tiêu chuẩn và dài hơn 16 lần so với ngữ cảnh 8.000 token. Ngoài độ dài bối cảnh dài hơn, độ chính xác của mô hình này khi xử lý bối cảnh dài cũng được cải thiện đáng kể.

Bản cập nhật thứ hai được kiểm soát nhiều hơn. Để cung cấp cho các nhà phát triển nhiều quyền kiểm soát hơn đối với các phản hồi và đầu ra của mô hình, họ đã giới thiệu một tính năng mới gọi là JSON Schema để đảm bảo rằng các mô hình phản hồi JSON hợp lệ, điều này sẽ đơn giản hóa đáng kể các lệnh gọi API. Mô hình cũng đã được cải thiện về các cuộc gọi hàm, cho phép nhiều hàm được gọi cùng một lúc và làm theo hướng dẫn tốt hơn. Họ cũng giới thiệu một tính năng mới gọi là "Đầu ra có thể tái tạo", cho phép mô hình trả về đầu ra nhất quán bằng cách truyền tham số hạt giống, rõ ràng cung cấp mức độ kiểm soát cao hơn đối với hành vi của mô hình. Tính năng này hiện đang trong giai đoạn thử nghiệm.

Trong những tuần tới, họ sẽ tung ra một tính năng mới cho phép các đầu dò nhật ký được xem trong API. Bản cập nhật thứ ba là kiến thức tốt hơn về thế giới. Để cung cấp cho mô hình quyền truy cập vào kiến thức thế giới chính xác hơn, họ đã giới thiệu một tính năng truy xuất cho phép kiến thức được trích xuất từ các tài liệu hoặc cơ sở dữ liệu bên ngoài. Họ cũng đã cập nhật thời hạn kiến thức, và kiến thức thế giới của GPT-4 Turbo đã được cập nhật đến tháng 4/2023 và sẽ tiếp tục được cải thiện.

Bản cập nhật thứ tư là một phương thức mới, DALL· E 3, khả năng hình ảnh của GPT-4 Turbo và mô hình chuyển văn bản thành giọng nói mới đều đến với API ngày hôm nay và một số ít khách hàng đã sử dụng DALL · E 3 Lập trình tạo ra hình ảnh và thiết kế. Hôm nay, Coca-Cola đang phát động một chiến dịch để cho phép khách hàng sử dụng DALL · E 3 Tạo thiệp chúc mừng Diwali.

Tất nhiên, hệ thống bảo mật của họ giúp các nhà phát triển ngăn chặn các ứng dụng bị lạm dụng và các công cụ này có thể được sử dụng trong API. GPT-4 Turbo hiện có thể chấp nhận đầu vào hình ảnh thông qua API và tạo chú thích, phân loại và phân tích. Ví dụ, Miis sử dụng công nghệ này để giúp những người mù hoặc có thị lực kém với các công việc hàng ngày, chẳng hạn như xác định sản phẩm trước mặt họ. Và với mô hình chuyển văn bản thành giọng nói mới, bạn sẽ có thể tạo âm thanh tự nhiên từ văn bản trong API, với sáu âm thanh đặt trước để lựa chọn.

Altman đã chơi một ví dụ về âm thanh cho thấy sự tự nhiên của mô hình chuyển văn bản thành giọng nói mới của họ. Công nghệ chuyển giọng nói thành giọng nói này làm cho sự tương tác của ứng dụng trở nên tự nhiên và dễ tiếp cận hơn, đồng thời mở ra nhiều trường hợp sử dụng như học ngôn ngữ và trợ lý giọng nói.

Altman cũng đã công bố phiên bản tiếp theo của mô hình nhận dạng giọng nói nguồn mở của họ, Whisper v3 và cho biết họ sẽ sớm bổ sung API. Phiên bản này đã cải thiện hiệu suất trong nhiều ngôn ngữ và ông nghĩ rằng các nhà phát triển sẽ thực sự thích nó.

Tiếp theo, ông thảo luận về vấn đề tùy biến. Kể từ khi ra mắt GPT 3.5 vài tháng trước, tính năng tinh chỉnh đã hoạt động tốt. Bắt đầu từ hôm nay, điều này sẽ được mở rộng cho phiên bản 16K của mô hình. Họ cũng mời những người dùng tích cực sử dụng tinh chỉnh đăng ký Chương trình Truy cập Thử nghiệm Tinh chỉnh GPT-4. API tinh chỉnh là lý tưởng để cải thiện hiệu suất của một mô hình có tương đối ít dữ liệu trong nhiều ứng dụng khác nhau, cho dù đó là học các lĩnh vực kiến thức hoàn toàn mới hay làm việc với một lượng lớn dữ liệu độc quyền.

Trong bản cập nhật thứ năm, Altman đã công bố một sáng kiến mới gọi là "Mô hình tùy chỉnh", nơi các nhà nghiên cứu của OpenAI sẽ hợp tác chặt chẽ với công ty để sử dụng các công cụ của họ để xây dựng các mô hình tùy chỉnh chuyên dụng cho các trường hợp sử dụng cụ thể. Điều này bao gồm sửa đổi từng bước của quy trình đào tạo mô hình, thực hiện đào tạo trước theo miền cụ thể, tùy chỉnh quy trình học tăng cường sau đào tạo và hơn thế nữa. Ông thừa nhận rằng lúc đầu họ sẽ không thể làm việc với nhiều công ty, điều này sẽ rất nhiều công việc và không rẻ, ít nhất là ban đầu. Nhưng nếu có những doanh nghiệp đang tìm cách đẩy mọi thứ đến giới hạn hiện tại của họ, hãy liên hệ với họ.

Ngoài ra, Altman đã công bố giới hạn lãi suất cao hơn. Họ sẽ tăng gấp đôi số lượng mã thông báo mỗi phút cho tất cả khách hàng GPT-4 hiện tại, giúp dễ dàng thực hiện nhiều hơn và có thể yêu cầu giới hạn tốc độ và thay đổi hạn ngạch hơn nữa trực tiếp trong cài đặt tài khoản API. Ngoài các giới hạn tỷ lệ này, họ cũng đã giới thiệu Copyright Shield, có nghĩa là nếu khách hàng phải đối mặt với khiếu nại pháp lý về vi phạm bản quyền, OpenAI sẽ can thiệp để bảo vệ khách hàng và trang trải các chi phí phát sinh. Điều này áp dụng cho cả ChatGPT Enterprise và API. Ông nhắc nhở rõ ràng mọi người rằng họ không bao giờ sử dụng dữ liệu từ API hoặc ChatGPT Enterprise để đào tạo.

Altman tiếp tục nói về một yêu cầu của nhà phát triển lớn hơn tất cả các yêu cầu trước đó và đó là vấn đề về giá cả. Ông tuyên bố rằng GPT-4 Turbo không chỉ thông minh hơn GPT-4 mà còn rẻ hơn, khiến mã thông báo giảm gấp 3 lần và giảm 2 lần mã thông báo hoàn thành. Giá mới là 0,01 USD cho mỗi 1.000 token nhắc nhở và 0,03 USD cho mỗi 1.000 token hoàn thành. Điều này dẫn đến tốc độ kết hợp của GPT-4 Turbo rẻ hơn 2,75 lần so với GPT-4. Họ đã làm việc rất chăm chỉ để đạt được điều này và hy vọng mọi người sẽ hào hứng với nó.

Họ đã phải lựa chọn giữa giá cả và tốc độ khi quyết định ưu tiên vấn đề giá cả, nhưng tiếp theo họ sẽ làm việc để tăng tốc độ. Ông cũng tuyên bố giảm giá cho GPT 3.5 Turbo 16K, với việc giảm 3 lần mã thông báo đầu vào và giảm 2 lần mã thông báo đầu ra, có nghĩa là GPT 3.516K hiện rẻ hơn so với mẫu GPT 3.54K trước đó. Phiên bản GPT 3.5 Turbo 16K tinh chỉnh cũng rẻ hơn so với phiên bản 4K tinh chỉnh cũ hơn và anh hy vọng những thay đổi này sẽ giải quyết phản hồi của mọi người và rất vui mừng mang lại những cải tiến này cho mọi người.

Giới thiệu tất cả, ông đề cập rằng OpenAI may mắn có một đối tác đóng vai trò quan trọng trong việc biến điều này thành hiện thực. Vì vậy, ông đã mời một vị khách đặc biệt, Satya Nadella, Giám đốc điều hành của Microsoft.

Nadella nhớ lại lần đầu tiên gặp OpenAI, Altman hỏi anh ta liệu anh ta có sẵn một số tín dụng Azure không, và họ đã đi một chặng đường dài kể từ đó. Ông ca ngợi OpenAI vì đã xây dựng một cái gì đó kỳ diệu và chia sẻ hai suy nghĩ của Microsoft về quan hệ đối tác: Thứ nhất, khối lượng công việc, nơi họ làm việc cùng nhau để xây dựng các hệ thống hỗ trợ các mô hình mà OpenAI đang xây dựng, từ nguồn điện đến trung tâm dữ liệu, đến giá đỡ và máy gia tốc, đến mạng. Mục tiêu của Microsoft là xây dựng hệ thống tốt nhất để OpenAI có thể xây dựng mô hình tốt nhất và cung cấp cho các nhà phát triển. Thứ hai, bản thân Microsoft là một nhà phát triển và đang xây dựng sản phẩm. Nadella đã đề cập rằng khi lần đầu tiên ông gặp GitHub Copilot và GPT, niềm tin của ông vào toàn bộ thế hệ mô hình cơ sở đã hoàn toàn thay đổi. Họ cam kết xây dựng sản phẩm của mình trên các API của OpenAI và hy vọng sẽ cung cấp GitHub Copilot Enterprise cho tất cả những người tham dự tham dự dùng thử.

Altman cũng hỏi Nadella về suy nghĩ của cô về tương lai của quan hệ đối tác và tương lai của AI. Nadella nhấn mạnh rằng Microsoft hoàn toàn cam kết cung cấp các hệ thống và tài nguyên điện toán cần thiết để hỗ trợ OpenAI trong tiến trình táo bạo trên lộ trình của mình. Họ cam kết cung cấp các hệ thống đào tạo và suy luận tốt nhất, cũng như các tài nguyên máy tính nhất, để OpenAI có thể tiếp tục thúc đẩy các cạnh tiên tiến. Nadella tin rằng giá trị thực sự của AI nằm ở khả năng trao quyền cho mọi người, phù hợp với sứ mệnh của OpenAI và Microsoft là trao quyền cho mọi người và mọi tổ chức trên hành tinh để làm nhiều hơn nữa. Ông đề cập rằng an ninh là trọng tâm chính trong sự hợp tác của họ, và đó là trọng tâm của những nỗ lực chung của họ, không phải là một suy nghĩ sau. Những lời của Nadella nhấn mạnh chiều sâu và mục đích của quan hệ đối tác OpenAI và Microsoft, thể hiện tầm nhìn chung của hai công ty để thúc đẩy tăng trưởng và áp dụng AI.

Altman sau đó chuyển sang chủ đề của hội nghị, và trong khi đó là một hội nghị dành cho các nhà phát triển, họ đã thực hiện một số cải tiến cho ChatGPT. Giờ đây, ChatGPT sử dụng GPT-4 Turbo và tất cả các cải tiến mới nhất, bao gồm thời gian giới hạn kiến thức mới nhất và sẽ tiếp tục được cập nhật, đã có hiệu lực trong cùng ngày. ChatGPT hiện có thể duyệt web, viết và chạy mã, phân tích dữ liệu, tạo hình ảnh và hơn thế nữa khi cần. Họ cũng đã nghe phản hồi của người dùng rằng bộ chọn mô hình cực kỳ khó chịu và do đó đã bị xóa. Bắt đầu từ hôm nay, người dùng không cần phải nhấp vào menu thả xuống và ChatGPT sẽ tự động biết nên sử dụng tính năng nào khi nào.

Altman chỉ ra rằng mặc dù giá cả là một vấn đề quan trọng, nhưng nó không phải là điều chính trong yêu cầu của nhà phát triển. Họ tin rằng nếu mọi người được cung cấp các công cụ tốt hơn, họ sẽ làm được những điều tuyệt vời. Mọi người muốn AI thông minh hơn, cá nhân hóa hơn, tùy chỉnh hơn và có thể làm được nhiều việc hơn thay mặt cho người dùng. Cuối cùng, người dùng chỉ cần yêu cầu PC và nó thực hiện tất cả các tác vụ này cho bạn. Trong lĩnh vực AI, những khả năng này thường được gọi là "tác nhân". Để giải quyết vấn đề bảo mật của AI, OpenAI tin rằng việc triển khai dần dần và lặp đi lặp lại là cách tiếp cận tốt nhất và tin rằng điều đặc biệt quan trọng là phải thận trọng hướng tới tương lai của "tác nhân" này. Điều này sẽ đòi hỏi rất nhiều công việc kỹ thuật và rất nhiều sự chu đáo từ phía xã hội.

Vì vậy, họ đã thực hiện bước nhỏ đầu tiên hướng tới tương lai này. Altman rất vui mừng được giới thiệu GPT – phiên bản ChatGPT được thiết kế riêng cho một mục đích cụ thể. Bạn có thể xây dựng phiên bản ChatGPT tùy chỉnh của hầu hết mọi thứ với hướng dẫn, kiến thức mở rộng và hành động, sau đó xuất bản nó cho người khác sử dụng. Bởi vì chúng kết hợp các hướng dẫn, kiến thức mở rộng và hành động, chúng có thể hữu ích hơn, phù hợp hơn với nhiều bối cảnh và cung cấp khả năng kiểm soát tốt hơn.

Họ sẽ làm cho nó dễ dàng hơn để hoàn thành các nhiệm vụ khác nhau hoặc chỉ làm cho nó thú vị hơn cho bạn. Bạn có thể sử dụng chúng trực tiếp trong ChatGPT. Trên thực tế, bạn có thể lập trình GPT bằng ngôn ngữ bằng cách nói chuyện với nó. Thật dễ dàng để tùy chỉnh hành vi cho phù hợp với nhu cầu của bạn. Điều này làm cho nó rất dễ dàng để xây dựng chúng và trao quyền cho tất cả mọi người.

Altman tiếp tục nói rằng họ sẽ chỉ ra GPT là gì, cách sử dụng chúng, cách xây dựng chúng và sau đó sẽ thảo luận về cách chúng sẽ được phân phối và khám phá. Sau đó, đối với các nhà phát triển, họ sẽ chỉ ra cách xây dựng những trải nghiệm giống như tác nhân này vào ứng dụng của riêng họ.

Ông trình bày một vài ví dụ. Các đối tác của Code.org đang làm việc để mở rộng chương trình giảng dạy khoa học máy tính của trường và họ có các khóa học được sử dụng bởi hàng chục triệu sinh viên trên khắp thế giới. Code.org đã phát triển một kế hoạch bài học và GPT để giúp giáo viên cung cấp trải nghiệm hấp dẫn hơn cho học sinh trung học cơ sở. Ví dụ: nếu giáo viên yêu cầu một cách sáng tạo để giải thích vòng lặp, nó sẽ làm như vậy và trong trường hợp này, nó sẽ giải thích nó bằng cách một nhân vật trò chơi điện tử liên tục nhặt tiền xu, điều này rất dễ hiểu đối với học sinh lớp tám. GPT này kết hợp chương trình giảng dạy và chuyên môn sâu rộng của code.org, cho phép giáo viên nhanh chóng và dễ dàng thích ứng với nhu cầu của họ.

Tiếp theo, Canva xây dựng GPT nơi bạn có thể bắt đầu công việc thiết kế bằng cách mô tả thiết kế bạn muốn bằng ngôn ngữ tự nhiên. Nếu bạn nói, hãy tạo một poster cho buổi tiếp tân Dev Day vào chiều nay và cung cấp một số chi tiết, nó sẽ tạo ra một số tùy chọn bắt đầu bằng cách gọi API của Canva.

Altman lưu ý rằng khái niệm này có thể quen thuộc với một số người. Họ đã phát triển plugin thành một hành động tùy chỉnh cho GPT. Bạn có thể tiếp tục trò chuyện với cái này để xem các lần lặp lại khác nhau và khi bạn thấy cái bạn thích, bạn có thể nhấp để đi du lịch đến Canva để có trải nghiệm thiết kế đầy đủ.

Sau đó, họ muốn chiếu trực tiếp GPT. Zapier đã xây dựng một GPT cho phép bạn thực hiện các hành động trên 6000 ứng dụng, mở ra một loạt các khả năng tích hợp. Altman đã giới thiệu Jessica, Kiến trúc sư giải pháp tại OpenAI, người sẽ phụ trách bài thuyết trình.

Kiến trúc sư giải pháp Jessica Shei đã lên sân khấu và nhanh chóng bắt đầu bản demo, với Jessica chỉ ra rằng GPT sẽ được đặt ở góc trên cùng bên trái của giao diện và hiển thị một ví dụ gọi là hành động AI Zapier. Cô ấy đã khoe lịch của mình trong ngày và nói rằng cô ấy đã kết nối GPT với lịch của mình.

Trong buổi thuyết trình, Jessica đã hỏi về lịch trình trong ngày. Cô nhấn mạnh rằng GPT được xây dựng với tính bảo mật và hệ thống yêu cầu sự cho phép của người dùng trước khi bất kỳ hành động hoặc dữ liệu nào được chia sẻ. Cô ấy cho phép GPT truy cập lịch trình của mình và giải thích rằng GPT được thiết kế để nhận hướng dẫn từ người dùng để quyết định chức năng nào cần gọi để thực hiện hành động thích hợp.

Tiếp theo, Jessica cho thấy cách GPT kết nối thành công với lịch của cô ấy và trích xuất thông tin sự kiện. Cô cũng hướng dẫn GPT kiểm tra xung đột trên lịch và cho thấy rằng nó đã xác định thành công. Sau đó, cô ấy trình bày cách cho một người tên Sam biết rằng cô ấy cần phải về sớm và chuyển sang trò chuyện với Sam để yêu cầu làm như vậy.

Khi GPT hoàn thành yêu cầu, Jessica hỏi Sam đã nhận được thông báo chưa, và Sam xác nhận đã nhận. Jessica đã sử dụng điều này như một ví dụ để minh họa tiềm năng của GPT và bày tỏ dự đoán của cô ấy về việc xem những gì người khác sẽ xây dựng.

Sam sau đó tiếp tục giới thiệu thêm các ví dụ về GPT. Ông đề cập rằng ngoài những cái đã được chứng minh, có rất nhiều GPT đang được tạo ra và sẽ sớm được tạo ra. Ông nhận ra rằng nhiều người muốn xây dựng GPT không thể lập trình, vì vậy họ đã giúp mọi người có thể lập trình GPT thông qua cuộc trò chuyện. Altman tin rằng ngôn ngữ tự nhiên sẽ là một phần quan trọng trong cách mọi người sẽ sử dụng máy tính trong tương lai và coi đây là một ví dụ ban đầu thú vị.

Tiếp theo, Altman chỉ ra cách xây dựng GPT. Ông muốn tạo ra một GPT giúp những người sáng lập và nhà phát triển đưa ra lời khuyên khi khởi động các dự án mới. Anh ta đi vào trình tạo GPT, nói với nó những gì anh ta muốn và GPT bắt đầu xây dựng các hướng dẫn chi tiết dựa trên mô tả của anh ta. Nó cũng đi kèm với một cái tên "Startup Mentor" và bắt đầu điền thông tin và các câu hỏi có thể có trong chế độ xem trước. Altman đã tải lên một bản ghi bài phát biểu trước đây của mình về tinh thần kinh doanh để đưa ra lời khuyên dựa trên nó, thêm "phản hồi ngắn gọn và mang tính xây dựng" vào chỉ thị.

Altman sau đó đã thử GPT này trong thẻ xem trước và hài lòng với kết quả. Anh quyết định chỉ đăng nó cho chính mình trong thời gian này, để anh có thể tinh chỉnh thêm và chia sẻ nó sau này. Anh ấy nói rằng anh ấy luôn muốn tạo ra một robot như vậy và bây giờ rất vui khi có thể biến nó thành hiện thực. Altman nhấn mạnh rằng GPT cho phép mọi người dễ dàng chia sẻ và khám phá những điều thú vị mà họ làm với ChatGPT. Mọi người có thể tạo GPT riêng tư hoặc chia sẻ công khai sáng tạo của họ thông qua các liên kết hoặc tạo GPT chỉ dành cho công ty của họ nếu họ sử dụng ChatGPT Enterprise. Họ có kế hoạch ra mắt một cửa hàng GPT vào cuối tháng này, nơi mọi người có thể liệt kê các GPT và OpenAI sẽ có các GPT tốt nhất và phổ biến nhất.

Altman cũng đề cập rằng OpenAI sẽ đảm bảo rằng GPT trong các cửa hàng tuân theo chính sách của họ và OpenAI coi trọng việc chia sẻ doanh thu và sẽ trả một phần doanh thu cho những người xây dựng GPT hữu ích và phổ biến nhất. Họ mong muốn thúc đẩy một hệ sinh thái sôi động thông qua GPT Store và rất vui mừng về nhiều thông tin sẽ được chia sẻ.

Altman cũng nhấn mạnh rằng đây là một hội nghị dành cho các nhà phát triển đang đưa các khái niệm tương tự vào API. Ông đề cập rằng nhiều người đã xây dựng trải nghiệm giống như proxy trên API, chẳng hạn như Shopify Sidekick và Discord's Collide, cũng như AI của tôi, một chatbot tùy chỉnh có thể được thêm vào các cuộc trò chuyện nhóm và cung cấp các đề xuất. Những kinh nghiệm này rất tuyệt, nhưng việc xây dựng chúng thường khó khăn, đôi khi mất hàng tháng và đội ngũ hàng chục kỹ sư. Để đơn giản hóa quy trình này, họ đã ra mắt API Hỗ trợ mới.

API Hỗ trợ bao gồm các luồng liên tục, trình thông dịch mã truy xuất tích hợp sẵn, trình thông dịch Python và môi trường hộp cát hoạt động và chức năng gọi hàm được cải thiện mà họ đã thảo luận trước đó.

Tiếp theo là Raman, Trưởng phòng Trải nghiệm Nhà phát triển tại OpenAI, cho thấy cách thức hoạt động của nó. Ramon nói rằng ông được khuyến khích khi thấy rất nhiều người kết hợp AI vào các ứng dụng của họ. Ramon thông báo rằng họ không chỉ giới thiệu các mẫu mới trong API mà còn rất vui mừng khi cải thiện trải nghiệm của nhà phát triển để mọi người dễ dàng xây dựng các tác nhân thứ cấp hơn. Sau đó, anh ta chỉ ra quá trình xây dựng trực tiếp.

Ramon đã giới thiệu ứng dụng du lịch mà anh đang xây dựng có tên là "wanderlust" dành cho các nhà thám hiểm trên khắp thế giới. Ông cũng giới thiệu các ý tưởng điểm đến được tạo ra với GPT-4, cũng như việc sử dụng DALL mới · Hình minh họa được tạo theo chương trình bởi API E 3. Sau đó, Ramon đã chỉ ra cách nâng cao ứng dụng bằng cách thêm một trợ lý đơn giản. Anh ta chuyển sang sân chơi công cụ hỗ trợ mới, tạo trợ lý, đặt tên cho nó, cung cấp hướng dẫn ban đầu, chọn mô hình, bật trình thông dịch mã và chức năng truy xuất, sau đó lưu.

Ramon tiếp tục giải thích cách tích hợp trợ lý vào ứng dụng, xem xét một số mã và trình bày cách tạo một luồng mới cho mỗi người dùng mới và thêm thông điệp của họ vào các luồng đó. Anh ta cũng chỉ ra cách chạy trợ lý bất cứ lúc nào để trả lại phản hồi cho ứng dụng.

Tiếp theo, Ramon giới thiệu function call, một tính năng mà anh đặc biệt thích. Các cuộc gọi hàm bây giờ đảm bảo đầu ra JSON và nhiều hàm có thể được gọi cùng một lúc. Sau đó, ông đã chứng minh cách trợ lý biết các tính năng để bao gồm các nhãn trên bản đồ bên phải và thêm các điểm đánh dấu vào bản đồ trong thời gian thực.

Ramon cũng thảo luận về tính năng truy xuất, đó là cung cấp cho các trợ lý nhiều kiến thức hơn là nhắn tin tức thời cho người dùng. Anh ta tải lên một tệp PDF, được hệ thống đọc và hiển thị trên màn hình. Sau đó, anh ta kéo và thả thông tin đặt phòng của Airbnb vào cuộc trò chuyện.

Ramon nhấn mạnh rằng các nhà phát triển thường cần tính toán nhúng, thiết lập các thuật toán chunking và bây giờ tất cả những điều này được xử lý bởi API trạng thái mới. Ông cũng hiển thị bảng điều khiển dành cho nhà phát triển nơi bạn có thể xem các bước được thực hiện bởi công cụ, bao gồm các chức năng đã được gọi và các tệp PDF đã được tải lên.

Ramon sau đó đã thảo luận về một tính năng mới mà nhiều nhà phát triển đang chờ đợi: trình thông dịch mã, hiện cũng có sẵn trong API. Nó cho phép AI viết và thực thi mã và thậm chí tạo tệp nhanh chóng. Ông chứng minh cách một trình thông dịch mã sẽ hoạt động nếu bạn nói một vấn đề yêu cầu chuyển đổi tiền tệ và tính toán ngày. Cuối cùng, Ramon phác thảo cách nhanh chóng tạo ra một tác nhân có thể quản lý trạng thái cho các cuộc hội thoại của người dùng, tận dụng các công cụ bên ngoài như truy xuất kiến thức và thông dịch mã và gọi các chức năng của riêng nó để thực hiện chức năng.

Ramon cũng giới thiệu các tính năng kết hợp các mẫu mới được phát hành và các cuộc gọi tính năng, và anh ấy đã xây dựng một trợ lý tùy chỉnh cho Dev Day. Hơn nữa, anh quyết định sử dụng giọng nói thay vì giao diện trò chuyện. Ông đã giới thiệu một ứng dụng Swift đơn giản có thể nhận đầu vào micrô và hiển thị những gì đang xảy ra trong nền trong nhật ký thiết bị đầu cuối. Anh ấy đã sử dụng whisper để chuyển đổi đầu vào bằng giọng nói thành văn bản, sử dụng trợ lý của GPT-4 Turbo và sử dụng API TTS mới để tạo ra âm thanh.

Ramon cũng chứng minh cách trợ lý có thể kết nối với internet và thực hiện các hành động trong thế giới thực cho người dùng. Anh ta đề nghị trợ lý đưa 500 đô la tín dụng OpenAI cho năm người tham gia Dev Day ngẫu nhiên và trợ lý đã hoàn thành nhiệm vụ thành công.

Cuối cùng, trong bài phát biểu kết thúc của mình tại Ngày nhà phát triển OpenAI, Sam Altman nói rằng API hỗ trợ đang trong giai đoạn thử nghiệm beta và ông rất vui mừng khi thấy các nhà phát triển sẽ sử dụng nó như thế nào. Ông nhấn mạnh rằng GPT và các công cụ hỗ trợ là người tiên phong trên con đường đến các tác nhân phức tạp hơn sẽ có thể lập kế hoạch và thực hiện các nhiệm vụ phức tạp hơn cho người dùng.

Altman nhắc lại tầm quan trọng của việc triển khai lặp đi lặp lại dần dần và khuyến khích mọi người bắt đầu sử dụng các tác nhân này ngay bây giờ để thích nghi với một thế giới tương lai, nơi họ trở nên có khả năng hơn. Ông đảm bảo rằng OpenAI sẽ tiếp tục cập nhật hệ thống dựa trên phản hồi của người dùng, nói rằng OpenAI có mật độ tài năng vượt trội, nhưng vẫn cần rất nhiều nỗ lực và phối hợp để đạt được tất cả những điều này. Anh ấy cảm thấy như mình có những đồng nghiệp tốt nhất trên thế giới và vô cùng biết ơn khi có thể làm việc với họ.

Đây là lý do tại sao nhóm của OpenAI đang làm việc rất chăm chỉ: họ tin rằng AI sẽ là một phần của cuộc cách mạng công nghệ và xã hội sẽ thay đổi thế giới theo nhiều cách. Altman đề cập rằng họ đã thảo luận trước đó rằng bằng cách cung cấp cho mọi người những công cụ tốt hơn, họ có thể thay đổi thế giới. Ông tin rằng AI sẽ mang lại sự trao quyền cá nhân và quy mô cơ quan chưa từng có, từ đó nâng nhân loại lên một tầm cao chưa từng có. Khi trí thông minh trở nên phổ biến hơn, tất cả chúng ta đều có siêu năng lực mọi lúc. Anh ấy rất hào hứng về cách bạn sẽ sử dụng công nghệ và tương lai mới mà chúng ta đang cùng nhau xây dựng.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

Phần thưởng
Thích
Bình luận
Chia sẻ

Bình luận

0/400

Không có bình luận

Chủ đề
#Gate & WLFI USD1 Points Program
12k Phổ biến
#Show My Alpha Points
75k Phổ biến
#ETH Whales Accumulate
19k Phổ biến
#SOL Futures Reach New High
22k Phổ biến
#ETH ETF Sees 12 Weeks of Inflows
7k Phổ biến

Ghim

sơ đồ trang web