Từ chuỗi khối đến LLM, diễn giải chuyên sâu về sự phát triển và thách thức của công nghệ lập chỉ mục dữ liệu

Kể từ khi Satoshi Nakamoto quyết định nhúng một thông điệp vào khối genesis, cấu trúc dữ liệu của chuỗi Bitcoin đã trải qua một loạt thay đổi.

Tôi bắt đầu nghiên cứu chuyên sâu về phát triển chuỗi khối vào năm 2022 và cuốn sách đầu tiên tôi đọc là "Làm chủ Ethereum". Cuốn sách này rất xuất sắc và cung cấp cho tôi rất nhiều hiểu biết sâu sắc về các nguyên tắc cơ bản của Ethereum và Blockchain. Tuy nhiên, từ quan điểm ngày nay, một số kỹ thuật phát triển trong cuốn sách đã trở nên lỗi thời. Các bước sơ bộ liên quan đến việc chạy một nút trên máy tính xách tay cá nhân, ngay cả đối với ví dApp, yêu cầu phải tải xuống một nút nhẹ. Điều này phản ánh mô hình hành vi của các nhà phát triển và tin tặc ban đầu trong hệ sinh thái phát triển chuỗi khối từ năm 2015 đến 2018.

Trở lại năm 2017, chúng tôi không có bất kỳ nhà cung cấp dịch vụ nút nào. Từ góc độ cung và cầu, chức năng chính của chúng là thực hiện các giao dịch do hoạt động của người dùng bị hạn chế. Điều này có nghĩa là việc tự duy trì hoặc lưu trữ một nút đầy đủ không phải là gánh nặng quá lớn, vì không có nhiều yêu cầu RPC để xử lý và yêu cầu chuyển là không thường xuyên. Hầu hết những người đầu tiên sử dụng Ethereum là những người đam mê công nghệ. Những người dùng ban đầu này có hiểu biết sâu sắc về phát triển chuỗi khối và được sử dụng để trực tiếp duy trì các nút Ethereum, tạo giao dịch và quản lý tài khoản thông qua dòng lệnh hoặc môi trường phát triển tích hợp.

Do đó, chúng ta có thể quan sát thấy rằng các dự án ban đầu thường có UI/UX rất rõ ràng. Một số dự án này thậm chí không có giao diện người dùng và hoạt động của người dùng khá thấp. Đặc điểm của các dự án này chủ yếu được xác định bởi hai yếu tố: hành vi của người dùng và cấu trúc dữ liệu của chuỗi.

Sự trỗi dậy của các nhà cung cấp nút

Khi ngày càng có nhiều người dùng không có nền tảng lập trình tham gia mạng blockchain, kiến trúc kỹ thuật của các ứng dụng phi tập trung cũng đã thay đổi. Chế độ lưu trữ nút ban đầu của người dùng đã dần thay đổi thành lưu trữ nút bởi các bên dự án

Từ chuỗi khối đến LLM, diễn giải chuyên sâu về quá trình phát triển và thách thức của công nghệ lập chỉ mục dữ liệu

Mọi người có xu hướng chọn dịch vụ lưu trữ nút, chủ yếu là do tốc độ tăng trưởng nhanh chóng của dữ liệu trên chuỗi khiến chi phí cho các nút lưu trữ cá nhân tăng dần theo thời gian.

Từ chuỗi khối đến LLM, diễn giải chuyên sâu về quá trình phát triển và thách thức của công nghệ lập chỉ mục dữ liệu

Tuy nhiên, các nút tự lưu trữ bởi các nhóm dự án vẫn là một thách thức đối với các nhà phát triển dự án nhỏ, đòi hỏi đầu tư bảo trì liên tục và chi phí phần cứng. Do đó, quy trình lưu trữ nút phức tạp này thường được giao cho các công ty chuyên bảo trì nút. Điều đáng nói là thời điểm xây dựng và gây quỹ quy mô lớn của các công ty này trùng với xu hướng dịch vụ đám mây đang lên trong ngành công nghệ Bắc Mỹ.

| Dự án | Chuyên mục | Được thành lập từ | | --- | --- | --- | | Giả kim thuật | Nút | 2017 | |Infura|Nút|2016| | NowNodes | Nút | 2019 | | Nút nhanh | Nút | 2017 | | Mỏ neo | nút | 2017 | | Chuỗi ngăn xếp | Nút | 2018 |

Từ chuỗi khối đến LLM, diễn giải chuyên sâu về quá trình phát triển và thách thức của công nghệ lập chỉ mục dữ liệu

Việc chỉ lưu trữ các nút từ xa không thể giải quyết hoàn toàn vấn đề, đặc biệt là hiện nay khi các giao thức liên quan như DeFi và NFT đang xuất hiện. Các nhà phát triển cần giải quyết rất nhiều vấn đề về dữ liệu, bởi vì dữ liệu do chính các nút blockchain cung cấp được gọi là dữ liệu thô, không được chuẩn hóa và làm sạch. Dữ liệu trong đó cần được trích xuất, làm sạch và tải.

Ví dụ: giả sử tôi là nhà phát triển dự án NFT và tôi muốn thực hiện giao dịch NFT hoặc hiển thị NFT. Sau đó, giao diện người dùng của tôi cần đọc dữ liệu NFT trong tài khoản EOA cá nhân theo thời gian thực. NFT thực sự chỉ là một dạng mã thông báo được tiêu chuẩn hóa. Sở hữu NFT có nghĩa là tôi sở hữu mã thông báo có ID duy nhất được tạo bởi hợp đồng NFT và hình ảnh của NFT thực sự là siêu dữ liệu, có thể là dữ liệu SVG hoặc liên kết đến hình ảnh trên IPFS. Mặc dù ứng dụng khách Geth của Ethereum cung cấp hướng dẫn lập chỉ mục, nhưng đối với một số dự án có yêu cầu giao diện người dùng lớn, việc yêu cầu Geth liên tục rồi quay lại giao diện người dùng là không thực tế. Đối với một số chức năng, chẳng hạn như đấu giá đơn đặt hàng và tổng hợp giao dịch NFT, chúng phải được thực hiện ngoài chuỗi để thu thập hướng dẫn người dùng, sau đó gửi các hướng dẫn này đến chuỗi vào thời điểm thích hợp.

Do đó, một lớp dữ liệu đơn giản đã ra đời. Để đáp ứng yêu cầu về thời gian thực và độ chính xác của người dùng, bên dự án cần xây dựng cơ sở dữ liệu và chức năng phân tích dữ liệu của riêng mình.

Từ chuỗi khối đến LLM, diễn giải chuyên sâu về quá trình phát triển và thách thức của công nghệ lập chỉ mục dữ liệu

**Trình chỉ mục dữ liệu đã phát triển như thế nào? **

Bắt đầu một dự án thường là một việc tương đối đơn giản. Bạn có một ý tưởng, đặt ra một số mục tiêu, tìm những kỹ sư giỏi nhất và xây dựng một nguyên mẫu hoạt động, thường bao gồm giao diện người dùng và một vài hợp đồng thông minh.

Tuy nhiên, khá khó khăn để làm cho quy mô dự án. Người ta cần suy nghĩ sâu sắc về cấu trúc thiết kế ngay từ ngày đầu tiên của dự án. Nếu không, bạn có thể nhanh chóng gặp sự cố mà tôi thường gọi là "sự cố đóng băng".

Từ chuỗi khối đến LLM, diễn giải chuyên sâu về quá trình phát triển và thách thức của công nghệ lập chỉ mục dữ liệu

Tôi đã mượn thuật ngữ này từ bộ phim "Iron Man", và nó có vẻ rất phù hợp để mô tả tình hình của hầu hết các công ty khởi nghiệp. Khi các công ty khởi nghiệp phát triển nhanh chóng (thu hút nhiều người dùng), họ thường gặp rắc rối vì họ không lường trước được điều đó ngay từ đầu. Trong phim, kẻ thủ ác không bao giờ mong đợi thiết bị chiến tranh của mình bay vào vũ trụ vì anh ta không tính đến "vấn đề đóng băng". Tương tự như vậy, đối với các nhà phát triển của nhiều dự án Web3, "vấn đề đóng băng" liên quan đến việc giải quyết gánh nặng ngày càng tăng của việc sử dụng hàng loạt người dùng. Điều này gây áp lực nặng nề lên phía máy chủ khi số lượng người dùng tăng lên chóng mặt. Ngoài ra còn có các vấn đề liên quan đến chính chuỗi khối, chẳng hạn như sự cố mạng hoặc tắt nút.

Từ chuỗi khối đến LLM, diễn giải chuyên sâu về quá trình phát triển và thách thức của công nghệ lập chỉ mục dữ liệu

Hầu hết thời gian đó là một vấn đề phụ trợ. Ví dụ, trong một số giao thức trò chơi blockchain, tình huống này không phải là hiếm. Khi họ lên kế hoạch bổ sung thêm nhiều máy chủ và thuê thêm các kỹ sư dữ liệu để phân tích dữ liệu trên chuỗi, họ đã không lường trước được có nhiều người dùng tham gia như vậy. Khi họ nhận ra điều này thì đã quá muộn. Và những vấn đề kỹ thuật này không thể được giải quyết chỉ bằng cách bổ sung thêm nhiều kỹ sư phụ trợ. Như tôi đã nói trước đây, những cân nhắc này nên được đưa vào kế hoạch ngay từ đầu.

Vấn đề thứ hai liên quan đến việc thêm các chuỗi khối mới. Bạn có thể đã tránh được các sự cố phía máy chủ ngay từ đầu và đã thuê rất nhiều kỹ sư giỏi. Tuy nhiên, người dùng của bạn có thể không hài lòng với chuỗi khối hiện tại. Họ muốn dịch vụ của bạn cũng chạy trên các chuỗi phổ biến khác như chuỗi zk hoặc chuỗi L2. Cấu trúc dự án của bạn có thể trông như thế này:

Từ chuỗi khối đến LLM, diễn giải chuyên sâu về quá trình phát triển và thách thức của công nghệ lập chỉ mục dữ liệu

Trong loại hệ thống này, bạn có toàn quyền kiểm soát dữ liệu của mình, điều này cho phép quản lý tốt hơn và tăng cường bảo mật. Hệ thống giới hạn yêu cầu cuộc gọi, giảm nguy cơ quá tải và tăng hiệu quả. Và thiết lập tương thích với giao diện người dùng, đảm bảo trải nghiệm người dùng và tích hợp liền mạch.

Tuy nhiên, chi phí vận hành và bảo trì tăng lên gấp bội, điều này có thể gây căng thẳng cho các nguồn lực của bạn. Việc thêm một chuỗi khối mới mỗi lần yêu cầu công việc lặp đi lặp lại, điều này có thể tốn thời gian và không hiệu quả. Chọn dữ liệu từ các bộ dữ liệu lớn có thể giảm thời gian truy vấn, có khả năng làm chậm quá trình. Do các vấn đề về mạng chuỗi khối như khôi phục và sắp xếp lại, dữ liệu có thể bị nhiễm độc, ảnh hưởng đến tính toàn vẹn và độ tin cậy của dữ liệu.

Các dự án được thiết kế để phản ánh các thành viên trong nhóm của bạn. Thêm nhiều nút hơn và cố gắng xây dựng một hệ thống tập trung vào phụ trợ có nghĩa là bạn cần thuê thêm kỹ sư để vận hành các nút đó và giải mã dữ liệu thô.

Mô hình này tương tự như những ngày đầu của Internet, khi các nền tảng thương mại điện tử và nhà phát triển ứng dụng chọn xây dựng các cơ sở IDC (Trung tâm dữ liệu Internet) của riêng họ. Tuy nhiên, chi phí đi đôi với sự phức tạp trong thiết kế chương trình khi yêu cầu của người dùng tăng lên và trạng thái của mạng chuỗi khối bùng nổ. Hơn nữa, cách tiếp cận này cản trở sự mở rộng nhanh chóng của thị trường. Một số chuỗi khối công cộng hiệu suất cao yêu cầu hoạt động nút chuyên sâu về phần cứng, trong khi việc đồng bộ hóa và làm sạch dữ liệu tiêu tốn nguồn nhân lực và chi phí thời gian.

Nếu bạn đang cố gắng xây dựng thị trường NFT dựa trên chuỗi khối hoặc trò chơi thú vị, thì có ngạc nhiên không khi 65% thành viên trong nhóm của bạn là kỹ sư phụ trợ và dữ liệu?

**Có lẽ các nhà phát triển sẽ thắc mắc tại sao không ai giải mã và truyền dữ liệu on-chain này cho họ để họ có thể tập trung vào việc xây dựng các sản phẩm tốt hơn. **

** Tôi tin rằng đây là lý do tại sao người lập chỉ mục ở đó. **

Từ chuỗi khối đến LLM, diễn giải chuyên sâu về quá trình phát triển và thách thức của công nghệ lập chỉ mục dữ liệu

Để giảm bớt khó khăn khi truy cập các ứng dụng Web3 và mạng chuỗi khối, nhiều nhóm phát triển bao gồm cả chúng tôi chọn tích hợp các bước như bảo trì nút lưu trữ, dữ liệu trên chuỗi ETL (trích xuất, chuyển đổi, tải) và các cuộc gọi cơ sở dữ liệu. Các nhiệm vụ này ban đầu yêu cầu nhóm dự án tự duy trì, nhưng giờ đây họ đã nhận ra các hoạt động tích hợp bằng cách cung cấp API nút và dữ liệu đa chuỗi.

Với sự trợ giúp của các API này, người dùng có thể tùy chỉnh dữ liệu trên chuỗi theo nhu cầu của họ. Điều này bao gồm mọi thứ từ siêu dữ liệu NFT phổ biến, giám sát hoạt động trên chuỗi của các địa chỉ cụ thể, đến theo dõi dữ liệu giao dịch của nhóm thanh khoản mã thông báo cụ thể. Tôi thường đề cập đến cách tiếp cận này như một phần cấu trúc của các dự án Web3 hiện đại.

Từ chuỗi khối đến LLM, diễn giải chuyên sâu về quá trình phát triển và thách thức của công nghệ lập chỉ mục dữ liệu

Việc tài trợ và xây dựng các dự án lớp dữ liệu và lớp chỉ mục sẽ chủ yếu được thực hiện vào năm 2022. Tôi tin rằng thực tiễn kinh doanh của các dự án lớp chỉ mục và lớp dữ liệu này có liên quan chặt chẽ đến thiết kế kiến trúc dữ liệu cơ bản của chúng, đặc biệt là thiết kế hệ thống OLAP (Xử lý phân tích trực tuyến). Việc áp dụng một công cụ lõi phù hợp là chìa khóa để tối ưu hóa hiệu suất của lớp chỉ mục, bao gồm cải thiện tốc độ lập chỉ mục và đảm bảo tính ổn định của nó. Các công cụ thường được sử dụng bao gồm Hive, Spark SQL, Presto, Kylin, Impala, Druid, ClickHouse, v.v. Trong số đó, ClickHouse là một cơ sở dữ liệu mạnh mẽ được sử dụng rộng rãi trong các công ty Internet, được mã nguồn mở vào năm 2016 và nhận được khoản tài trợ 250 triệu đô la Mỹ vào năm 2021.

Từ chuỗi khối đến LLM, diễn giải chuyên sâu về quá trình phát triển và thách thức của công nghệ lập chỉ mục dữ liệu

Do đó, sự xuất hiện của một thế hệ cơ sở dữ liệu mới và các kiến trúc tối ưu hóa chỉ mục dữ liệu được cải thiện đã dẫn đến việc tạo ra lớp chỉ mục dữ liệu Web3. Điều này cho phép các công ty trong lĩnh vực này cung cấp dịch vụ API dữ liệu một cách nhanh hơn và hiệu quả hơn.

Tuy nhiên, việc xây dựng chỉ mục dữ liệu trên chuỗi vẫn bị bao phủ bởi hai đám mây đen.

Hai đám mây đen

Đám mây đen đầu tiên nói về tác động của sự ổn định mạng chuỗi khối đối với phía máy chủ. Mặc dù mạng blockchain có tính ổn định mạnh mẽ, nhưng điều đó không xảy ra trong quá trình truyền và xử lý dữ liệu. Ví dụ: các sự kiện như sắp xếp lại (reorgs) và khôi phục (rollback) của chuỗi khối có thể đặt ra thách thức đối với tính ổn định dữ liệu của bộ chỉ mục.

Tổ chức lại chuỗi khối là khi các nút tạm thời mất đồng bộ hóa, khiến hai phiên bản khác nhau của chuỗi khối tồn tại cùng một lúc. Những tình huống như vậy có thể được kích hoạt bởi lỗi hệ thống, sự chậm trễ của mạng hoặc thậm chí là hành vi nguy hiểm. Khi các nút đồng bộ lại, chúng sẽ hội tụ thành một chuỗi chính thức duy nhất và các khối "phân nhánh" thay thế trước đó sẽ bị loại bỏ.

Vào thời điểm tổ chức lại xảy ra, bộ lập chỉ mục có thể đã xử lý dữ liệu từ các khối mà cuối cùng đã bị loại bỏ, gây ô nhiễm cơ sở dữ liệu. Do đó, những người lập chỉ mục phải thích ứng với tình huống này, loại bỏ dữ liệu trên các chuỗi không hợp lệ và xử lý lại dữ liệu trên các chuỗi mới được chấp nhận.

Từ chuỗi khối đến LLM, diễn giải chuyên sâu về quá trình phát triển và thách thức của công nghệ lập chỉ mục dữ liệu

Những điều chỉnh như vậy có thể dẫn đến việc tăng mức sử dụng tài nguyên và có khả năng làm chậm sự sẵn có của dữ liệu. Trong những trường hợp cực đoan, việc tổ chức lại khối quy mô lớn hoặc thường xuyên có thể ảnh hưởng nghiêm trọng đến độ tin cậy và hiệu suất của các dịch vụ phụ thuộc vào bộ chỉ mục, bao gồm cả những ứng dụng Web3 sử dụng API để tìm nạp dữ liệu.

Ngoài ra, chúng tôi đang phải đối mặt với các vấn đề liên quan đến khả năng tương thích định dạng dữ liệu và tính đa dạng của các tiêu chuẩn dữ liệu trên các mạng chuỗi khối.

Trong lĩnh vực công nghệ chuỗi khối, có nhiều mạng khác nhau, mỗi mạng có các tiêu chuẩn dữ liệu riêng. Ví dụ: có các chuỗi tương thích EVM (Ethereum Virtual Machine), chuỗi không phải EVM và chuỗi zk (zero-knowledge), mỗi chuỗi có cấu trúc và định dạng dữ liệu đặc biệt của riêng nó.

Đây chắc chắn là một thách thức lớn đối với các nhà lập chỉ mục. Để cung cấp dữ liệu hữu ích và chính xác thông qua API, người lập chỉ mục cần có khả năng xử lý các định dạng dữ liệu đa dạng này. Tuy nhiên, do không có tiêu chuẩn chung cho dữ liệu chuỗi khối nên những người lập chỉ mục khác nhau có thể sử dụng các tiêu chuẩn API khác nhau. Điều này có thể dẫn đến các vấn đề về khả năng tương thích dữ liệu, trong đó dữ liệu được trích xuất và chuyển đổi từ một bộ chỉ mục có thể không sử dụng được trong một hệ thống khác.

Từ chuỗi khối đến LLM, diễn giải chuyên sâu về quá trình phát triển và thách thức của công nghệ lập chỉ mục dữ liệu

Ngoài ra, khi các nhà phát triển khám phá thế giới đa chuỗi này, họ thường phải đối mặt với thách thức xử lý các tiêu chuẩn dữ liệu khác nhau này. Một giải pháp hoạt động cho một mạng blockchain có thể không hoạt động cho một mạng khác, gây khó khăn cho việc phát triển các ứng dụng có thể tương tác với nhiều mạng.

Thật vậy, những thách thức mà ngành lập chỉ mục blockchain phải đối mặt gợi nhớ đến hai vấn đề chưa được giải quyết trong vật lý được xác định bởi Lord Kelvin vào đầu thế kỷ 20, cuối cùng đã khai sinh ra các lĩnh vực mang tính cách mạng như cơ học lượng tử và nhiệt động lực học.

Đối mặt với những thách thức này, ngành thực sự đã thực hiện một số bước, chẳng hạn như giới thiệu độ trễ hoặc tích hợp phát trực tuyến trong đường dẫn Kafka và thậm chí thành lập một tập đoàn tiêu chuẩn để củng cố ngành công nghiệp lập chỉ mục chuỗi khối. Các biện pháp này hiện có thể giải quyết sự không ổn định của mạng blockchain và sự đa dạng của các tiêu chuẩn dữ liệu, để người lập chỉ mục có thể cung cấp dữ liệu chính xác và đáng tin cậy.

Tuy nhiên, giống như sự ra đời của lý thuyết lượng tử đã cách mạng hóa sự hiểu biết của chúng ta về thế giới vật chất, chúng ta cũng có thể xem xét các cách triệt để hơn để cải thiện cơ sở hạ tầng dữ liệu chuỗi khối.

**Xét cho cùng, cơ sở hạ tầng hiện tại, với các ngăn xếp và kho dữ liệu được sắp xếp gọn gàng, có vẻ quá hoàn hảo và quá đẹp để trở thành sự thật. **

Vì vậy, ** Có cách nào khác không? **

Tìm mẫu

Hãy quay lại chủ đề ban đầu về sự xuất hiện của các nhà cung cấp nút và người lập chỉ mục, đồng thời xem xét một vấn đề đặc biệt. Tại sao các nhà khai thác nút không xuất hiện vào năm 2010, nhưng các nhà lập chỉ mục đột nhiên xuất hiện với số lượng lớn và nhận được rất nhiều đầu tư vào năm 2022?

Tôi tin rằng phần trên của tôi đã trả lời một phần những câu hỏi này. Điều này là do việc sử dụng rộng rãi các công nghệ lưu trữ dữ liệu và điện toán đám mây trong ngành công nghiệp phần mềm, không chỉ trong lĩnh vực mã hóa.

Trong thế giới mã hóa, một điều đặc biệt cũng đã xảy ra, đặc biệt là khi các tiêu chuẩn ERC20 và ERC721 trở nên phổ biến trên các phương tiện truyền thông đại chúng. Ngoài ra, mùa hè DeFi đã làm cho dữ liệu trên chuỗi trở nên phức tạp hơn. Các giao dịch cuộc gọi khác nhau được định tuyến trên các hợp đồng thông minh khác nhau, thay vì dữ liệu giao dịch đơn giản như ở giai đoạn đầu, định dạng và độ phức tạp của dữ liệu trên chuỗi đã trải qua những thay đổi và tăng trưởng đáng ngạc nhiên.

Từ chuỗi khối đến LLM, diễn giải chuyên sâu về quá trình phát triển và thách thức của công nghệ lập chỉ mục dữ liệu

Mặc dù trong cộng đồng tiền điện tử, nó luôn được nhấn mạnh để tách biệt khỏi công nghệ Web2 truyền thống, nhưng điều chúng ta không thể bỏ qua là sự phát triển của cơ sở hạ tầng tiền điện tử dựa trên sự phát triển liên tục và đột phá trong các lĩnh vực toán học, mật mã, công nghệ đám mây và dữ liệu lớn. . . Tương tự như cấu trúc mộng và mộng truyền thống của Trung Quốc, các thành phần khác nhau trong hệ sinh thái tiền điện tử được kết nối chặt chẽ.

Sự tiến bộ và ứng dụng sáng tạo của khoa học và công nghệ sẽ luôn bị ràng buộc bởi một số nguyên tắc khách quan. Ví dụ: nếu không có sự hỗ trợ cơ bản của công nghệ mã hóa đường cong elip, hệ sinh thái tiền điện tử của chúng ta ngày nay không thể tồn tại. Tương tự như vậy, ứng dụng thực tế của bằng chứng không kiến thức sẽ không thể thực hiện được nếu không có tài liệu nghiên cứu quan trọng về bằng chứng không kiến thức do MIT xuất bản năm 1985. Vì vậy, chúng tôi thấy một mô hình thú vị. ** Ứng dụng rộng rãi và sự mở rộng của các nhà cung cấp dịch vụ nút dựa trên sự phát triển nhanh chóng của các dịch vụ đám mây toàn cầu và công nghệ ảo hóa. ** Đồng thời, Sự phát triển của lớp dữ liệu trên chuỗi dựa trên sự phát triển mạnh mẽ của kiến trúc và dịch vụ cơ sở dữ liệu nguồn mở xuất sắc,** những kiến trúc này là giải pháp dữ liệu mà nhiều sản phẩm kinh doanh thông minh dựa vào trong những năm gần đây **. Đây là tất cả các điều kiện tiên quyết kỹ thuật mà các công ty khởi nghiệp phải đáp ứng để đạt được khả năng thương mại. Khi nói đến các dự án Web3, những dự án sử dụng cơ sở hạ tầng tiên tiến có xu hướng có lợi thế hơn những dự án dựa trên kiến trúc lỗi thời. Sự xói mòn thị phần của OpenSea bởi các sàn giao dịch NFT nhanh hơn và thân thiện với người dùng hơn là một ví dụ sinh động.

Ngoài ra, chúng ta cũng có thể thấy một xu hướng rõ ràng: công nghệ trí tuệ nhân tạo (AI) và LLM đã dần trưởng thành và có khả năng ứng dụng rộng rãi.

**Do đó, một câu hỏi quan trọng được đặt ra: AI sẽ thay đổi mô hình dữ liệu trên chuỗi như thế nào? **

Bói

Dự đoán tương lai luôn đầy khó khăn, nhưng chúng ta có thể khám phá các câu trả lời khả thi bằng cách hiểu các vấn đề gặp phải trong quá trình phát triển chuỗi khối. **Các nhà phát triển có nhu cầu rõ ràng về dữ liệu trên chuỗi: thứ họ cần là dữ liệu trên chuỗi chính xác, kịp thời và dễ hiểu. **

Một trong những vấn đề mà chúng tôi hiện đang gặp phải là các truy vấn SQL phức tạp được yêu cầu để lấy hoặc hiển thị một số dữ liệu nhất định theo lô. Đây là lý do tại sao chức năng SQL nguồn mở do Dune cung cấp lại rất phổ biến trong cộng đồng tiền điện tử. Người dùng không cần viết sql để tạo biểu đồ từ đầu, họ chỉ cần rẽ nhánh và sửa đổi địa chỉ của hợp đồng thông minh mà họ muốn chú ý, sau đó họ có thể tạo biểu đồ họ cần. Tuy nhiên, điều này vẫn còn quá phức tạp đối với người dùng bình thường chỉ muốn xem dữ liệu thanh khoản hoặc airdrop trong một số điều kiện nhất định.

Theo tôi, bước đầu tiên để giải quyết vấn đề này là sử dụng LLM và xử lý ngôn ngữ tự nhiên.

Chúng tôi có thể xây dựng giao diện "truy vấn dữ liệu" lấy người dùng làm trung tâm hơn và tận dụng các kỹ thuật LLM. Trong các trường hợp hiện tại, người dùng phải sử dụng các ngôn ngữ truy vấn phức tạp như SQL hoặc GraphQL để trích xuất dữ liệu trên chuỗi tương ứng từ API hoặc Studios. Tuy nhiên, bằng cách sử dụng LLM, chúng tôi có thể giới thiệu một cách đặt câu hỏi trực quan và giống con người hơn. Bằng cách này, người dùng có thể diễn đạt câu hỏi của mình bằng "ngôn ngữ tự nhiên" và LLM sẽ dịch chúng thành các truy vấn phù hợp và cung cấp cho người dùng câu trả lời họ cần.

Từ chuỗi khối đến LLM, diễn giải chuyên sâu về quá trình phát triển và thách thức của công nghệ lập chỉ mục dữ liệu

Từ góc độ của các nhà phát triển, trí tuệ nhân tạo cũng có thể tối ưu hóa việc phân tích các sự kiện hợp đồng trên chuỗi và giải mã ABI. Hiện tại, chi tiết của nhiều hợp đồng DeFi yêu cầu các nhà phát triển phải phân tích và giải mã chúng theo cách thủ công. Tuy nhiên, nếu trí tuệ nhân tạo được giới thiệu, chúng ta có thể cải thiện đáng kể các kỹ thuật tháo gỡ hợp đồng khác nhau và nhanh chóng truy xuất ABI tương ứng. Được kết hợp với một mô hình ngôn ngữ lớn (LLM), cấu hình này có thể phân tích cú pháp chữ ký chức năng một cách thông minh và xử lý hiệu quả các loại dữ liệu khác nhau. Hơn nữa, khi hệ thống được kết hợp với khung xử lý "stream computing", nó có thể xử lý phân tích dữ liệu giao dịch theo thời gian thực để đáp ứng nhu cầu tức thời của người dùng.

Từ góc độ toàn cầu hơn, mục tiêu của người lập chỉ mục là cung cấp cho người dùng dữ liệu chính xác. Như tôi đã nhấn mạnh trước đây, một vấn đề tiềm ẩn với lớp dữ liệu trên chuỗi là các phần dữ liệu riêng lẻ nằm rải rác trên các cơ sở dữ liệu lập chỉ mục khác nhau và bị cô lập khỏi nhau. Để đáp ứng nhu cầu dữ liệu đa dạng, một số nhà thiết kế chọn tích hợp tất cả dữ liệu trên chuỗi vào cơ sở dữ liệu để người dùng có thể chọn thông tin cần thiết từ một tập dữ liệu. Một số giao thức chọn chỉ bao gồm một số dữ liệu, chẳng hạn như dữ liệu DeFi và dữ liệu NFT. Nhưng vấn đề về tiêu chuẩn dữ liệu không tương thích vẫn tồn tại. Đôi khi, các nhà phát triển cần tìm nạp dữ liệu từ nhiều nguồn và định dạng lại dữ liệu đó trong cơ sở dữ liệu của riêng họ, điều này chắc chắn làm tăng gánh nặng bảo trì của họ. Ngoài ra, họ không thể chuyển sang nhà cung cấp khác kịp thời nếu có vấn đề với một nhà cung cấp dữ liệu.

Từ chuỗi khối đến LLM, diễn giải chuyên sâu về quá trình phát triển và thách thức của công nghệ lập chỉ mục dữ liệu

Vậy LLM và AI có thể giải quyết vấn đề này như thế nào? LlamaIndex cung cấp cho tôi một tiết lộ. Điều gì sẽ xảy ra nếu các nhà phát triển không cần bộ lập chỉ mục mà sử dụng dịch vụ proxy đã triển khai (tác nhân) để đọc trực tiếp dữ liệu thô trên chuỗi? Đại lý này kết hợp các công nghệ của người lập chỉ mục và LLM. Từ quan điểm của người dùng, họ không cần biết gì về API hoặc ngôn ngữ truy vấn, họ chỉ cần đặt câu hỏi và nhận phản hồi ngay lập tức.

Từ chuỗi khối đến LLM, diễn giải chuyên sâu về quá trình phát triển và thách thức của công nghệ lập chỉ mục dữ liệu

Được trang bị LLM và công nghệ trí tuệ nhân tạo, Agent hiểu và xử lý dữ liệu thô và chuyển đổi nó thành định dạng mà người dùng dễ hiểu. Điều này giúp người dùng không phải đối mặt với các API hoặc ngôn ngữ truy vấn phức tạp và họ có thể chỉ cần đặt câu hỏi bằng ngôn ngữ tự nhiên và nhận phản hồi theo thời gian thực. Tính năng này làm tăng khả năng truy cập và tính thân thiện với người dùng của dữ liệu, thu hút cơ sở người dùng rộng hơn để truy cập dữ liệu trên chuỗi.

Ngoài ra, cách thức phục vụ của đại lý (Agent) giải quyết vấn đề không tương thích chuẩn dữ liệu. Vì nó được thiết kế với khả năng phân tích cú pháp và xử lý dữ liệu thô trên chuỗi, nên nó có thể thích ứng với các định dạng và tiêu chuẩn dữ liệu khác nhau. Do đó, các nhà phát triển không cần phải định dạng lại dữ liệu từ các nguồn khác nhau, giúp giảm khối lượng công việc của họ.

Tất nhiên, đây chỉ là suy đoán về quỹ đạo phát triển trong tương lai của dữ liệu trên chuỗi. Nhưng trong công nghệ, những ý tưởng và lý thuyết táo bạo này thường thúc đẩy tiến bộ mang tính cách mạng. Chúng ta nên nhớ rằng cho dù đó là phát minh ra bánh xe hay sự ra đời của blockchain, tất cả những bước đột phá lớn đều bắt đầu từ giả định hoặc ý tưởng “điên rồ” của một ai đó.

Khi chúng ta chấp nhận sự thay đổi và sự không chắc chắn, chúng ta cũng được thử thách liên tục vượt qua các ranh giới của khả năng. Trong bối cảnh đó, chúng tôi hình dung ra một thế giới nơi sự kết hợp giữa AI, LLM và chuỗi khối sẽ tạo ra một lĩnh vực công nghệ cởi mở và toàn diện hơn.

Chainbase duy trì tầm nhìn này và cam kết biến nó thành hiện thực.

Nhiệm vụ của chúng tôi tại Chainbase là tạo ra một cơ sở hạ tầng dữ liệu được mã hóa mở, thân thiện, minh bạch và bền vững. Mục tiêu của chúng tôi là đơn giản hóa việc sử dụng dữ liệu này của các nhà phát triển, loại bỏ nhu cầu tái cấu trúc phức tạp của ngăn xếp công nghệ phụ trợ. Bằng cách này, chúng tôi hy vọng sẽ mở ra một tương lai trong đó công nghệ không chỉ phục vụ người dùng mà còn trao quyền cho họ.

Tuy nhiên, tôi phải làm rõ rằng đây không phải là lộ trình của chúng tôi. Thay vào đó, đây là phản ánh của cá nhân tôi về sự phát triển và tiến độ gần đây của dữ liệu trên chuỗi trong cộng đồng với tư cách là đại diện quan hệ của nhà phát triển.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)