Hôm nay, "trình thông dịch mã" ChatGPT chính thức bị dỡ bỏ! Biến ảnh thành video trong 30 giây và làm đồng hồ bằng miệng | Toàn bộ tác phẩm của mười phép thuật tuyệt vời

Nguồn: Xinzhiyuan

Chờ đợi hơn 3 tháng, "trình thông dịch mã" ChatGPT cuối cùng cũng được mở hoàn toàn và một làn sóng thần kỳ đang đến.

Các gia đình, nó cuối cùng đã ở đây!

Vừa rồi, phiên bản beta "trình thông dịch mã" ChatGPT đã chính thức mở cửa cho tất cả người dùng Plus.

Karpathy, một nhà khoa học tại OpenAI, cũng đã công khai điều này và phiên bản beta của trình thông dịch mã khá mạnh mẽ.

Đó là nhà phân tích dữ liệu cá nhân của bạn: có thể đọc các tệp đã tải lên, thực thi mã, tạo biểu đồ, phân tích thống kê, v.v. Tôi hy vọng sẽ mất một thời gian để cộng đồng phát huy hết tiềm năng của nó.

Cách đây một thời gian, sự suy giảm khả năng của GPT4 đã gây náo động trên Internet và một số người thậm chí còn cho rằng nó mạnh hơn GPT3.5 một chút.

Và giờ đây, trình thông dịch mã lại khiến người ta có cảm giác, GPT-4 quen thuộc và mạnh mẽ đã trở lại!

Ngay sau khi plug-in được tung ra, nhiều cư dân mạng đã bắt đầu thử nghiệm nó.

Mở khóa chức năng

Vì vậy, chính xác thì "trình thông dịch mã" có thể làm gì?

30 giây, ảnh trở thành video

Không, một số cư dân mạng thực sự đã sử dụng ChatGPT để chuyển ảnh thành video. Hiệu ứng này còn bùng nổ hơn cả Midjourney và Runway.

Làm thế nào điều này được thực hiện? Cư dân mạng đã đưa ra một bộ hướng dẫn đầy đủ.

Bước 1: Mở "Mô hình phiên dịch mã". Để bật nó, hãy đi tới Cài đặt -> Tính năng Beta -> Trình thông dịch mã.

Bước hai:

Chọn tùy chọn Trình thông dịch mã từ trình đơn thả xuống. Sau đó, tải lên hình ảnh bạn muốn tạo hiệu ứng động.

Bước thứ ba:

Tôi muốn giới thiệu một số món ăn từ một nhà hàng sang trọng. Vì vậy, tôi đã yêu cầu ChatGPT tạo hiệu ứng cho bức ảnh đồ ăn này từ trái sang phải. Bằng cách sửa đổi gợi ý GPT của tôi (xem bên dưới), bạn có thể tạo hoạt ảnh của riêng mình.

chi tiết như sau:

Bước bốn:

Bấm phím Enter. Sau 30 giây, ChatGPT sẽ cung cấp cho bạn một liên kết tải xuống của video.

Đồng sáng lập Greg Brockman retweet trình thông dịch mã để chuyển đổi hình ảnh khi không thể nhớ các cuộc gọi ffmpeg.

Thực tế đã chứng minh “trình thông dịch mã” thực sự tốt, bây giờ cắt video chỉ cần một câu là xong.

"Có một giới hạn dung lượng bộ nhớ nhất định, nhưng không có vấn đề gì khi xử lý các tệp nhỏ. Tôi vừa ném một video gen-2 dài 4 giây cho TA, chặn hai giây đầu tiên, không vấn đề gì và nó đã được thực hiện nhanh chóng.

Nó sẽ tự động kiểm tra mã phù hợp, nếu bạn muốn lập trình, bạn có thể ném tệp tin cho ta và yêu cầu, sau đó xem mã do ta cung cấp.”

### PDF sang hình ảnh

"Bao Yu", một blogger công nghệ Internet nổi tiếng ở Trung Quốc, đã sử dụng một "trình thông dịch mã" để chuyển đổi các tệp PDF thành hình ảnh.

Trước đây, phải ghép nội dung của từng trang vào một bức tranh thì nay, người ta có thể làm được.

### GIF sang video

Ngoài việc chuyển đổi ảnh thành video, bạn cũng có thể chuyển đổi GIF thành video.

Cư dân mạng đã gợi ý cho ChatGPT: Tôi tải ảnh GIF lên, bạn đưa cho tôi tệp MP4 5s và sử dụng ống kính câu chuyện để phóng to từ từ.

Tải ảnh GIF lên

Cuối cùng ChatGPT đã tạo video ngay lập tức

, thời lượng 00:05

Ngoài ra, ChatGPT còn có thể tạo ảnh GIF "ma trận".

### Tạo mã QR

Hai ngày trước, OpenAI đã thông báo rằng "trình thông dịch mã" ChatGPT sẽ được mở hoàn toàn.

Nó cho thấy một ví dụ có thể tạo mã QR, chỉ trong một câu, bạn có thể hoàn thành nhiệm vụ chỉ bằng cách di chuyển miệng.

### Nhà phân tích dữ liệu "bỏ túi"

Trường hợp sử dụng lớn nhất cho trình thông dịch mã là phân tích dữ liệu.

Ví dụ: hãy để nó phân tích dữ liệu tuổi thọ của các quốc gia khác nhau, các thành phố lớn nhất trên thế giới, (bạn có thể tải lên các tệp CSV, word, PDF hoặc video)

Sau đó, nói chuyện với dữ liệu và hỏi bất kỳ câu hỏi nào bạn có thể muốn hỏi.

Hoặc yêu cầu trích xuất các xu hướng ngẫu nhiên duy nhất từ dữ liệu của bạn để tạo bất ngờ.

Ví dụ: tìm các xu hướng duy nhất trong hai tập dữ liệu và hiển thị chúng ở dạng bảng.

Bước cuối cùng, hình dung.

Biến dữ liệu thành bất kỳ biểu đồ hoặc đồ thị nào bạn muốn. Hay nhất của tất cả, nó chỉ là một cú nhấp chuột.

Ví dụ: tạo biểu đồ phân tán minh họa mối quan hệ giữa GDP bình quân đầu người của một quốc gia và tuổi thọ trung bình của quốc gia đó.

Nhìn thấy một "nhà phân tích dữ liệu" mạnh mẽ như vậy, cư dân mạng lại bắt đầu RIP.

hướng dẫn người dùng

Làm cách nào để sử dụng "trình thông dịch mã"? Một giáo sư của Wharton, Ethan Mollick, đã viết một hướng dẫn dành riêng cho việc này.

Đầu tiên, Mollick chỉ ra rằng cái tên Code Interpreter tiếp tục truyền thống lâu đời của OpenAI là đặt cho sản phẩm của họ những cái tên xấu.

Bởi vì—mặc dù nó được gọi là "trình thông dịch mã", nhưng trên thực tế, nó hữu ích nhất cho những người không hiểu gì về lập trình.

Về cơ bản, "trình thông dịch mã" cho phép GPT-4 tải lên và tải xuống thông tin, đồng thời viết và thực thi các chương trình cho người dùng, điều này cho phép AI thực hiện tất cả những việc mà trước đây nó không thể làm được.

Cụ thể, nó cung cấp cho AI hộp công cụ giải quyết vấn đề chung (bằng cách viết mã bằng Python), bộ nhớ lớn (lên tới 100MB, có thể ở dạng nén) và người dùng có thể tích hợp hộp công cụ này vào AI để chơi LLM.

Điều này giúp khắc phục nhiều sự cố với các phiên bản ChatGPT trước đó. Ví dụ,

Nó cho phép AI xử lý toán học (ngay cả khi nó phức tạp), nhưng cũng xử lý các từ chính xác hơn (chẳng hạn như thực sự đếm các từ trong một đoạn văn), và lý do cơ bản là nó có thể viết mã Python để giải quyết các điểm yếu tự nhiên của LLM trong toán học và ngôn ngữ.

Ví dụ như hình bên dưới.

Như bạn có thể thấy, "trình thông dịch mã" có thể đếm chính xác số lượng từ trong đoạn văn.

Ngoài ra, "trình thông dịch mã" làm giảm khả năng ảo giác và vô nghĩa.

Khi một AI sử dụng Python trực tiếp, mã sẽ giúp giữ cho nó "trung thực". Lý do cũng rất đơn giản, nếu code sai Python sẽ báo lỗi. Vì mã hoạt động trên dữ liệu nên AI không thể chèn lỗi vào dữ liệu.

Tất nhiên, nó không hoàn hảo. Vẫn có khả năng AI sẽ bị ảo giác, nhưng điều này không phổ biến và không có khả năng ảnh hưởng đến chính mã hoặc dữ liệu.

Bằng cách này, AI tiến gần hơn đến trí tuệ nhân tạo nói chung - một số lượng lớn các vấn đề có thể được giải quyết bằng mã.

Hơn nữa, GPT-4 rất giỏi trong việc quyết định thời điểm sử dụng "trình thông dịch mã" theo những cách mới và thú vị.

Mollick đưa ra một ví dụ, nếu anh ấy để GPT-4 chứng minh với người dùng rằng trái đất hình tròn, thì một "trình thông dịch mã" sẽ được sử dụng, cung cấp nhiều đối số, kết hợp văn bản với mã và hình ảnh.

Trước đây, những người cần lập trình ở nhiều chuyên ngành khác nhau phải biết viết mã, nhưng họ phải tự gỡ lỗi sau khi viết. Ngay cả khi AI trước đó có thể cung cấp một số trợ giúp, thì vẫn khá khó khăn đối với những người không có kiến thức cơ bản về Python và họ phải sử dụng sức mạnh của AI để sửa đổi mã nhiều lần.

Và giờ đây, với "trình thông dịch mã", AI có thể tự sửa lỗi và gỡ lỗi!

Sau đó, Mollick nói về cách sử dụng "trình thông dịch mã" để xử lý dữ liệu, đây có thể được coi là một điểm thực sự khó khăn đối với một số lượng lớn người dùng.

Mollick nói rằng "trình thông dịch mã" hoạt động ở cấp độ rất tiên tiến, có thể tự động xử lý nhiều phân tích định lượng phức tạp và có thể áp dụng các phương pháp dữ liệu rất phức tạp.

Người dùng có thể dễ dàng tải lên dữ liệu, thậm chí cả dữ liệu nén như tệp ZIP, chỉ bằng cách nhấp vào dấu cộng.

Đồng thời, khi cung cấp dữ liệu, tốt nhất là người dùng có thể cung cấp dữ liệu. Sau đó, AI có thể tìm ra ý nghĩa và cấu trúc của dữ liệu từ ngữ cảnh!

Ngoài ra, Mollick chỉ ra rằng khi sử dụng "trình thông dịch mã", người dùng sẽ "đối thoại" nhiều hơn với AI và không cần phải vắt óc viết một đoạn mã chặt chẽ và ngắn gọn.

Cũng giống như trò chuyện với một nhà phân tích dữ liệu, cách bạn nói chuyện với mọi người là cách bạn giao tiếp với "người phiên dịch mã".

Nhưng có hai trường hợp đặc biệt ở đây, và bạn vẫn cần phải viết một cái gì đó tương tự.

Một là AI đôi khi không nhớ nó có thể làm gì, lúc này nó cần một người đánh thức AI.

Ví dụ: "Bạn có thể tạo ảnh GIF, hãy thử."

Một tình huống khác là khi người dùng không hài lòng với kết quả, "trình thông dịch mã" có thể được sử dụng để tối ưu hóa kết quả.

Ví dụ: "Vui lòng chạy thử nghiệm thêm về kết quả này" hoặc "Có thể làm cho biểu đồ này tốt hơn không".

Sau khi tải dữ liệu, GPT có thể thực hiện các hoạt động hợp nhất và làm sạch dữ liệu. Phương pháp xử lý cụ thể khá phức tạp, nhưng như đã đề cập ở trên, chỉ cần nghĩ về "trình thông dịch mã" là một nhà phân tích dữ liệu trực diện.

Đồng thời, Mollick cũng nhắc nhở người dùng rằng tốt nhất nên kiểm tra kết quả sau khi AI tự hiệu chỉnh và tự sửa lỗi, đề phòng có sự cố xảy ra.

Ngay sau khi Mollick thực hành xong, anh đã nhờ "người giải mật mã" làm một mô hình dự đoán để đoán xem một siêu anh hùng có thể có những siêu năng lực gì.

Như bạn có thể thấy, "trình thông dịch mã" xây dựng Nhà phân phối rừng ngẫu nhiên.

Tất nhiên, trong quá trình hoạt động thực tế, người dùng vẫn phải "giao tiếp nhiều hơn" với GPT. Mollick không muốn AI sử dụng dữ liệu số để ước tính dữ liệu bị thiếu mà Mollick muốn trực tiếp loại bỏ phần còn thiếu.

Nhưng anh ấy chỉ ra rằng cũng có thể nói chuyện với GPT và để nó thay đổi sang một phương thức xử lý khác.

Sau đó, Mollick đưa cho GPT một câu hỏi "Bạn có thể thực hiện một phân tích phức tạp và thú vị khác không?". Anh ấy nói rằng anh ấy rất ấn tượng với một số phương pháp phân tích do Code Interpreter lựa chọn.

Cũng giống như hình dưới đây.

"Người phiên dịch mật mã" khéo léo phân tích tình hình mạng của các siêu cường quốc. Như bạn có thể thấy, các phương pháp rất đa dạng và rất thú vị.

Điều ấn tượng nhất về "trình thông dịch mã" phải là khả năng suy luận của nó. Mollick đã tóm tắt nó là rất "con người".

Ngoài ra, mức độ tương tác trong trực quan hóa vẫn trực tuyến và đang được cải thiện. Người dùng có thể liên tục để AI cải thiện hoặc thay đổi nội dung đầu ra.

Mollick đã nhờ AI tạo một bảng tương tác, bao gồm sáu biểu đồ, trong đó có một biểu đồ ở dạng 3D.

Để biểu đồ đẹp hơn, Mollick tiếp tục nhập và điều chỉnh kết quả.

Kết quả cuối cùng trông giống như bên phải trong hình bên dưới.

Top 10 Phép Thuật Tuyệt Vời

Cư dân mạng @GPTDAOCN gần đây đã tóm tắt mười trường hợp sử dụng gây sốc hàng đầu của ChatGPT:

Trực quan hóa trình thông dịch mã

  1. Chuyển đổi GIF sang MP4: Nó có thể chuyển đổi ảnh động (GIF) thành tệp video (MP4), giúp bạn chia sẻ và sử dụng dễ dàng hơn.

  2. Tạo nhiều đồ họa khác nhau: Bạn có thể sử dụng chức năng này để tạo nhiều đồ họa khác nhau như biểu đồ, biểu đồ đường, biểu đồ hình tròn, v.v., để trình bày và phân tích dữ liệu của bạn một cách trực quan.

  3. Trích xuất màu từ hình ảnh để tạo bảng màu PNG: Chức năng này có thể trích xuất các màu chính từ bất kỳ hình ảnh nào, sau đó tạo bảng màu ở định dạng PNG.

  4. Dọn dẹp dữ liệu để tạo trực quan chuyên sâu: Nếu bạn có một số dữ liệu lộn xộn, tính năng này có thể giúp bạn dọn dẹp và sắp xếp dữ liệu, sau đó chuyển đổi dữ liệu đó thành một trực quan rõ ràng.

  5. Chuyển đổi tệp CSV sang GIF: Chức năng này có thể hiển thị dữ liệu trong tệp CSV (giá trị được phân tách bằng dấu phẩy) theo cách động và tạo ảnh GIF.

  6. Phân tích danh sách nhạc để tóm tắt sở thích âm nhạc của bạn: Bạn có thể sử dụng chức năng này để phân tích danh sách nhạc nhằm tóm tắt sở thích âm nhạc của mình.

  7. Chuyển đổi tập dữ liệu của bạn thành một trang web HTML đầy đủ chức năng: Tính năng này có thể nhanh chóng chuyển đổi dữ liệu của bạn thành một trang web đầy đủ chức năng để bạn hiển thị và chia sẻ.

  8. Tạo tập dữ liệu chứng khoán có thể tải xuống: Chức năng này giúp bạn tạo tập dữ liệu chứng khoán và có thể tải xuống tập dữ liệu này để bạn phân tích và nghiên cứu chuyên sâu.

  9. Chuyển ảnh sang file văn bản: Nếu bạn cần trích xuất văn bản từ ảnh, chức năng này có thể giúp bạn chuyển chữ trong ảnh sang file văn bản.

  10. Phân tích chi tiết dữ liệu chưa định dạng: Đối với những dữ liệu thô không có định dạng cụ thể, chức năng này có thể giúp bạn tiến hành phân tích chuyên sâu để thu được thông tin có giá trị.

Trên thực tế, các trường hợp sử dụng trình thông dịch mã còn nhiều hơn thế.

Bình luận của cư dân mạng

Tôi đang dùng thử trình thông dịch mã ChatGPT. Cho đến nay, tất cả những gì tôi có thể đề xuất là "mọi nhà phát triển bắt đầu làm việc với nó ngay bây giờ".

Có bao nhiêu mạng sống của con người đã bị cắt đứt bởi Phiên dịch mã? Quá nhiều quản trị viên xử lý dữ liệu không hiệu quả mỗi ngày và giờ đây chỉ cần ngôn ngữ tự nhiên để tự động hóa văn phòng.

Người giới thiệu:

Xem bản gốc
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)