Một nhóm chỉ mới thành lập được vài tuần đã hoàn thành khoản tài trợ 105 triệu euro mà không có sản phẩm, không có người dùng và không có kinh nghiệm vận hành. Bản ghi nhớ (memo) này đã giúp nó thuyết phục được Light Speed, cựu CEO Google Eric Schmidt và những người khác. Bản ghi nhớ nhấn mạnh thị trường châu Âu, bảo mật AI, tuân thủ và các khía cạnh khác, Mistral tin rằng việc họ sử dụng lộ trình nguồn mở hoàn toàn khác với OpenAI cuối cùng sẽ cho phép anh ta thiết lập lợi thế và đạt được thành tích vượt trội. Từ những gì tôi đọc được, bản ghi nhớ này rõ ràng được viết rất khéo léo, và nó cũng chứa một số yếu tố bịp bợm. Nó đã tận dụng tốt tâm lý FOMO hiện tại của xã hội châu Âu về mô hình ngôn ngữ lớn để hoàn thành việc tài trợ.
Mistral sẵn sàng chỉ một cơn gió lạnh tây bắc khô và mạnh ở miền nam nước Pháp, đồng thời nó cũng là tên của một loại tàu tấn công đổ bộ do Pháp sản xuất. Đây là tàu tấn công đổ bộ hàng đầu thế giới. Cái tên thể hiện niềm tự hào của người Pháp. Sáu thành viên của nhóm sáng lập đều đến từ Pháp, thay vì hiểu nó là một công ty người mẫu lớn nói tiếng Châu Âu, tôi lại nghĩ nó giống một công ty người mẫu lớn nói tiếng Pháp hơn. Anh ấy kể một câu chuyện châu Âu hay, nhưng nó sẽ không phải là câu chuyện duy nhất ở châu Âu.
Tôi thấy Memo trong một nhóm thảo luận, sau khi xác định nội dung Memo không cần giữ bí mật nữa, tôi đã sử dụng ChatGPT để dịch toàn văn, sau đó hiệu đính và dịch lại một phần nội dung.
mistral.ai Bản ghi chiến lược
Tác giả: mistral.ai
Dịch: ChatGPT, Wang Chao
Trí tuệ nhân tạo sáng tạo là một công nghệ biến đổi
Trong năm ngoái, chúng ta đã chứng kiến sự tăng tốc phi thường của AI tổng quát (các hệ thống có khả năng tạo văn bản/hình ảnh từ văn bản và hình ảnh). Những hệ thống này có thể giúp con người:
● Sản xuất nội dung xuất sắc và sáng tạo (văn bản, mã, đồ họa)
● Đọc, xử lý và tóm tắt các luồng nội dung phi cấu trúc nhanh hơn con người hàng nghìn lần
● Tương tác với thế giới thông qua ngôn ngữ tự nhiên hoặc API để thực thi quy trình công việc nhanh hơn bao giờ hết.
Các khả năng mạnh mẽ của AI tổng quát bất ngờ được tiết lộ cho công chúng sau khi phát hành ChatGPT. Những sản phẩm như vậy chỉ được sản xuất bởi một số nhóm nhỏ trên khắp thế giới và số lượng hạn chế các nhà nghiên cứu trong các nhóm này đã trở thành nút cổ chai ngăn cản việc tạo ra một nền kinh tế mới trong lĩnh vực này.
AI sáng tạo sắp tăng năng suất trong tất cả các ngành và tạo ra một ngành mới bằng cách liên tục tăng cường khả năng máy móc của trí óc con người (thị trường trị giá 10 tỷ USD vào năm 2022, dự kiến đạt 110 tỷ USD vào năm 2030, tốc độ tăng trưởng hàng năm dự kiến là 35%). Đó là một công nghệ biến đổi cho nền kinh tế thế giới sẽ thay đổi bản chất của công việc và mang lại thay đổi xã hội tích cực.
Độc quyền nhóm đang được hình thành
Các kỹ thuật AI sáng tạo dựa trên cơ sở nhiều năm nghiên cứu trong ngành và học viện. Bằng cách mở rộng quy mô đào tạo thành dữ liệu quy mô Internet và sửa mô hình bằng phản hồi của con người, những đột phá giúp công nghệ có thể tiếp cận được với đại chúng đã đạt được bởi một số ít người chơi trong ngành, trong đó lớn nhất (OpenAI) dường như có ý định bá chủ về thị trường.
Một số ít người chơi này đào tạo các mô hình tổng quát và sử dụng chúng làm tài sản; họ phục vụ hàng nghìn bên thứ ba, những người tạo ra sản phẩm để cải thiện năng suất, cũng như công chúng thông qua các sản phẩm của riêng họ như chatbot. Một số lượng lớn các công ty khởi nghiệp bên thứ ba vẫn đang được thành lập để xây dựng các dịch vụ khác nhau dựa trên các mô hình chung này.
**Chúng tôi tin rằng phần lớn giá trị trong thị trường AI tổng quát mới nổi đến từ công nghệ khó chế tạo, chính các mô hình tổng quát. **Những mô hình này cần được đào tạo trên hàng nghìn cỗ máy mạnh mẽ, xử lý hàng nghìn tỷ dữ liệu từ các nguồn chất lượng cao, tạo nên tiêu chuẩn cao đầu tiên. Rào cản quan trọng thứ hai là khó khăn trong việc xây dựng một đội ngũ giàu kinh nghiệm và mistral.ai đang ở một vị trí thuận lợi để làm điều này.
Hiện tại (GLM) tất cả các công ty lớn đều ở Mỹ, chưa có đối thủ cạnh tranh nghiêm trọng nào ở Châu Âu. Với mức độ mạnh mẽ (và nguy hiểm) của công nghệ mới này, đây là một câu hỏi địa chính trị lớn. mistral.ai sẽ dẫn đầu châu Âu về AI giúp tăng năng suất và khả năng sáng tạo, đồng thời định hướng cuộc cách mạng công nghiệp mới sắp tới.
AI thế hệ hiện tại không đáp ứng nhu cầu thị trường
OpenAI và các đối thủ cạnh tranh hiện tại của nó đã chọn con đường công nghệ khép kín, điều này sẽ hạn chế đáng kể mức độ bao phủ thị trường của họ. Theo cách tiếp cận này, mô hình được giữ ở chế độ riêng tư và chỉ được cung cấp thông qua API chuyển văn bản thành văn bản. Điều này đặt ra những câu hỏi quan trọng sau đây cho doanh nghiệp:
● Các tổ chức muốn sử dụng các kỹ thuật AI tổng quát buộc phải cung cấp dữ liệu kinh doanh có giá trị và dữ liệu nhạy cảm của người dùng cho một mô hình hộp đen, thường được triển khai trên đám mây công cộng. Điều này đặt ra một vấn đề bảo mật: không thể kiểm tra một mô hình được giữ bí mật để đảm bảo rằng đầu ra của nó an toàn và một mô hình như vậy không thể được triển khai trong một ứng dụng quan trọng về bảo mật. Tình huống này cũng làm nảy sinh các vấn đề pháp lý, đặc biệt là khi một công ty chuyển dữ liệu cá nhân ra ngoài ranh giới pháp lý của công ty, vốn có thể chịu sự điều chỉnh của luật pháp ngoài lãnh thổ.
● Chỉ hiển thị đầu ra của mô hình, thay vì mô hình đầy đủ, khiến việc giao tiếp với các thành phần khác (cơ sở dữ liệu truy xuất, đầu vào có cấu trúc, hình ảnh và âm thanh) trở nên khó khăn hơn. Hiện tại có hàng trăm sản phẩm tạo ra các khả năng tổng hợp (ví dụ: bộ nhớ, tầm nhìn, v.v.) bằng cách kết nối đầu ra và đầu vào của các mô hình với nhau. Những sản phẩm này sẽ hoạt động tốt hơn và nhanh hơn nếu mô hình có thể được cung cấp dưới dạng hộp trắng (mô hình trong suốt) (chẳng hạn như The Flamingo tích hợp mô hình hình ảnh và văn bản của hộp trắng thành mô hình văn bản+hình ảnh).
● Dữ liệu được sử dụng để đào tạo mô hình là bí mật, có nghĩa là chúng tôi dựa vào các hệ thống có nguồn gốc không chắc chắn và có thể tạo ra đầu ra không kiểm soát được. Các nỗ lực lọc để giải quyết vấn đề này chỉ cung cấp những đảm bảo yếu và mong manh rằng mô hình sẽ không xuất ra nội dung nhạy cảm mà nó có thể đã được đào tạo để thực hiện. Vấn đề này đã dẫn đến việc ChatGPT bị cấm ở Ý vào tháng 4 năm 2023.
Phá vỡ mô hình thị trường từ Châu Âu
Bằng cách thành lập mistral.ai, chúng tôi dự định có lập trường hoàn toàn trái ngược với các mô hình khép kín hiện tại để đào tạo các mô hình tiên tiến. **Tầm nhìn của chúng tôi là trở thành công ty hàng đầu trong lĩnh vực này đồng thời tích hợp các mô hình này ở Châu Âu và toàn ngành để phát triển một doanh nghiệp có giá trị cao. **
**mistral.ai sẽ dẫn đầu nghiên cứu về AI tổng hợp và trong vòng 4 năm tới sẽ là nhà cung cấp công nghệ AI hàng đầu trên thị trường. **Để đạt được mục tiêu này, trước tiên chúng tôi sẽ tập trung vào một vài đặc điểm khác biệt chính, sau đó tiến hành nỗ lực R&D toàn diện để chọn ra các chiến lược hiệu quả nhất nhằm hướng tới trí tuệ nhân tạo có giá trị thiết thực đối với con người.
Tập trung vào thị trường châu Âu trước tiên sẽ mang lại cho chúng tôi lợi thế phòng thủ và lập trường cởi mở của chúng tôi về lộ trình công nghệ sẽ nâng cao hơn nữa sức hấp dẫn của chúng tôi. Nhiều bộ óc thông minh nhất trong lĩnh vực Mô hình hóa ngôn ngữ lớn (LLM) là người châu Âu; kinh nghiệm sâu rộng của chúng tôi cho thấy rằng nhiều người trong số họ muốn tham gia dự án của chúng tôi.
Định vị kỹ thuật đối diện
Những điểm khác biệt ban đầu của chúng tôi, những điểm mù trong chiến lược của đối thủ cạnh tranh, là:
● **Thực hiện một cách tiếp cận cởi mở hơn để phát triển mô hình. **Chúng tôi sẽ phát hành mô hình này theo giấy phép phần mềm nguồn mở dễ dãi, giấy phép này sẽ về cơ bản vượt trội so với đối thủ. Chúng tôi sẽ phát hành các công cụ để khai thác sức mạnh của các mô hình hộp trắng này và tạo cộng đồng nhà phát triển xung quanh thương hiệu của chúng tôi. Cách tiếp cận này rất khác về mặt ý thức hệ so với OpenAI, điều này sẽ thu hút tốt hơn các nhà nghiên cứu hàng đầu và nó sẽ là một động lực thúc đẩy mạnh mẽ cho sự phát triển của dự án, bởi vì nó sẽ cung cấp cho rất nhiều nhà phát triển nhiệt tình ở hạ lưu mở cửa. Điều này sẽ tăng phạm vi phát triển kinh doanh của chúng tôi. Chúng tôi sẽ cân bằng chiến lược nguồn mở của mình với các lợi ích tài chính, dành riêng các mô hình mạnh mẽ và chuyên nghiệp nhất cho người dùng trả tiền.
○ Chúng tôi sẽ dành 1% quỹ cho các quỹ phi lợi nhuận chịu trách nhiệm phát triển cộng đồng nguồn mở.
● Cho dù là mã nguồn mở hay được cấp phép, nội bộ (kiến trúc và trọng số được đào tạo) của các mô hình của chúng tôi luôn mở cho khách hàng của chúng tôi. **Điều này sẽ cho phép tích hợp chặt chẽ hơn với quy trình công việc của khách hàng, nội dung của chúng có thể được đưa vào các phần khác nhau của mô hình sâu, thay vì để mọi thứ được đánh số tự động dưới dạng văn bản đầu vào, được đưa vào API hộp đen. **
● **Tăng cường tập trung vào nguồn gốc dữ liệu và kiểm soát dữ liệu. **Các mô hình của chúng tôi sẽ được đào tạo về nội dung dữ liệu chất lượng cao (không phải nội dung cóp nhặt) mà chúng tôi sẽ đàm phán thỏa thuận cấp phép. Điều này sẽ cho phép chúng tôi đào tạo các mô hình tốt hơn các mô hình hiện có như Llama. Bằng cách sử dụng các kỹ thuật tương tác sâu (chuyên gia kết hợp và mô hình tăng cường truy xuất), chúng tôi sẽ cung cấp cho các mô hình quyền truy cập nguồn dữ liệu tùy chọn: đối với người dùng cao cấp trả phí, các mô hình cụ thể có thể được dành riêng cho tài chính/pháp lý/v.v. (điều này giúp tăng hiệu suất đáng kể ). Sử dụng các kỹ thuật tương tự, mô hình của chúng tôi sẽ có thể cung cấp quyền truy cập dữ liệu khác biệt tức thì cho nhân viên có các quyền sở hữu trí tuệ khác nhau của công ty.
● **Cung cấp bảo mật và quyền riêng tư vô song. **Mô hình của chúng tôi sẽ có thể triển khai trong đám mây riêng và tùy chọn trực tiếp trên thiết bị, giảm thiểu hiệu quả các mối lo ngại về quyền riêng tư bằng cách loại bỏ các quy trình có khả năng gây vấn đề. Để đạt được mục tiêu này, chúng tôi sẽ hướng các nỗ lực R&D của mình vào việc đào tạo các mô hình nhỏ nhưng siêu hiệu quả, đề xuất hiệu quả các mô hình có tỷ lệ chất lượng/chi phí cao nhất trên thị trường. Chiến lược nguồn mở của chúng tôi cũng sẽ đảm bảo khả năng kiểm tra của các mô hình của chúng tôi khi được triển khai cho các ngành chính (đặc biệt là ngành y tế và kép).
Phát triển kinh doanh
Về mặt kinh doanh, chúng tôi sẽ cung cấp các mô-đun kỹ thuật có giá trị nhất cho ngành công nghiệp dịch vụ AI mới nổi và sử dụng AI tổng quát để thay đổi hoàn toàn quy trình kinh doanh. Chúng tôi sẽ đồng xây dựng các giải pháp tích hợp với các nhà tích hợp châu Âu và khách hàng công nghiệp, đồng thời nhận phản hồi vô cùng quý giá từ họ để trở thành công cụ chính cho tất cả các công ty muốn tận dụng AI ở châu Âu.
Tích hợp với các ngành dọc có thể có các hình thức thị trường khác nhau, bao gồm giấy phép truy cập đầy đủ vào các mô hình (bao gồm cả trọng lượng được đào tạo), chuyên môn hóa các mô hình dựa trên nhu cầu, hợp đồng thương mại với các nhà tích hợp/công ty tư vấn để xây dựng các giải pháp tích hợp đầy đủ. Như được trình bày chi tiết trong lộ trình của chúng tôi, chúng tôi sẽ khám phá và xác định các phương pháp tiếp cận tốt nhất khi công nghệ phát triển.
Làm thế nào để trở thành người dẫn đầu trong lĩnh vực AI
Đội bóng hàng đầu
Nhóm sáng lập bao gồm các nhà nghiên cứu hàng đầu trong lĩnh vực đã từng làm việc tại DeepMind và Meta, cũng như các doanh nhân nối tiếp giàu kinh nghiệm của Pháp và các nhà lãnh đạo công có ảnh hưởng.
● Arthur Mensch — Giám đốc điều hành — Nguyên Trưởng phòng khoa học nghiên cứu tại DeepMind, tác giả chính của một số đóng góp lớn cho LLM: Chinchilla, Retro, Flamingo
● Guillaume Lample — Nhà khoa học trưởng — Cựu nhà khoa học nghiên cứu cấp cao của Meta. Dẫn dắt dự án Llama, đóng góp lớn của Meta cho lĩnh vực mô hình ngôn ngữ lớn
● Timothée Lacroix — CTO — Cựu kỹ sư phần mềm tại Meta, trưởng nhóm kỹ thuật tại Llama
● Jean-Charles Samuelian,Alan Giám đốc điều hành
● Charles Gorintin,Alan CTO
● Cédric O, cựu Bộ trưởng Ngoại giao Pháp về các vấn đề kỹ thuật số
Năm nhân viên đầu tiên đã được xác định sẽ là các nhà nghiên cứu có kinh nghiệm từ các công ty công nghệ lớn. Sự nhiệt tình của họ đối với châu Âu và khái niệm về nguồn mở, cũng như việc tái cơ cấu tổ chức liên tục của một số công ty do sự phát triển nhanh chóng của trí tuệ nhân tạo AI, cũng là thời điểm thích hợp để họ rời khỏi các công ty này.
Cơ sở hạ tầng và nguồn dữ liệu
Để đào tạo một mô hình cạnh tranh, một cụm quy mô cũ cần được sử dụng trong ít nhất vài tháng. Chúng tôi dự định thuê các tài nguyên máy tính như vậy trong cả năm, từ đó phát triển các mô hình mã nguồn mở và thương mại với các khả năng khác nhau.
Chúng tôi đã tiến hành đàm phán cạnh tranh với các nhà cung cấp dịch vụ đám mây hàng đầu về việc thuê tài nguyên máy tính (chúng tôi dự định bắt đầu vào mùa hè và hình thành dự trữ máy tính 1536 H100 vào tháng 9). Vì mistral.ai có nền tảng vững chắc ở châu Âu nên chúng tôi cũng sẽ hợp tác với các nhà cung cấp dịch vụ đám mây mới nổi ở châu Âu đang tích cực mở rộng các dịch vụ điện toán học sâu.
Chúng tôi đã đào tạo các mô hình quy mô lớn trước đây, điều này cung cấp cho chúng tôi kiến thức chuyên môn để đào tạo nhanh hơn 10-100 lần so với các phương pháp có sẵn công khai - những người sáng lập và nhân viên ban đầu của chúng tôi biết rõ cách đào tạo mô hình mạnh nhất với ngân sách tính toán nhất định.
Các nhà đầu tư ban đầu của chúng tôi cũng là nhà cung cấp nội dung ở Châu Âu và sẽ mở ra tất cả các cánh cửa cần thiết để chúng tôi có được bộ dữ liệu chất lượng cao mà chúng tôi có thể đào tạo và tinh chỉnh các mô hình của mình.
Khám phá các kịch bản cùng với các khách hàng quan trọng
Nhóm sáng lập đã tổ chức các cuộc thăm dò thương mại với các tổ chức thương mại lớn của Pháp và Châu Âu. Một nhóm nhỏ định hướng sản phẩm (6 người vào cuối năm) sẽ bắt đầu phát triển doanh nghiệp trong khi nhóm kỹ thuật đào tạo các mô-đun kỹ thuật có giá trị.
Nhóm người mẫu sẽ vẫn tập trung 100% vào việc phát triển công nghệ để tránh bị phân tâm.
Việc phát triển kinh doanh sẽ bắt đầu đồng thời với sự phát triển của dòng mô hình thế hệ đầu tiên, sử dụng các chiến lược sau:
● Tập trung khám phá nhu cầu của những người chơi công nghiệp lớn, được hỗ trợ bởi các nhà tích hợp bên thứ 3, những người sẽ được cấp quyền truy cập đầy đủ vào các mô hình (không phải nguồn mở) tốt nhất của chúng tôi
● Đồng thiết kế sản phẩm với một số đối tác nhỏ mới nổi tập trung vào các sản phẩm AI sáng tạo.
Khám phá dựa trên kinh doanh sẽ được sử dụng để thúc đẩy thiết kế của mô hình thế hệ thứ hai.
bản đồ tuyến đường
năm đầu tiên
Chúng tôi sẽ đào tạo hai thế hệ người mẫu, đồng thời phát triển mô hình và tích hợp thương mại. Thế hệ đầu tiên sẽ là nguồn mở một phần, dựa trên công nghệ mà nhóm đã thành thạo. Nó sẽ xác nhận khả năng của chúng tôi trong việc đáp ứng nhu cầu của khách hàng, nhà đầu tư và tổ chức của chúng tôi. Mô hình thế hệ thứ hai sẽ giải quyết những thiếu sót đáng kể của mô hình hiện tại, cho phép các doanh nghiệp sử dụng nó một cách an toàn và tiết kiệm.
Đào tạo mô hình tiêu chuẩn mã nguồn mở tốt nhất
Đến cuối năm 2023, chúng tôi sẽ đào tạo một loạt mô hình tạo văn bản có thể vượt trội đáng kể so với ChatGPT 3.5 và phiên bản Bard tháng 3 năm 2023, cũng như tất cả các giải pháp nguồn mở.
Sê-ri này sẽ là mã nguồn mở; chúng tôi sẽ tham gia vào cộng đồng để xây dựng dựa trên nó, làm cho nó trở thành một tiêu chuẩn mở.
Chúng tôi sẽ cung cấp giao diện dịch vụ giống như các đối thủ cạnh tranh của mình và tính phí thu thập dữ liệu sử dụng của bên thứ ba, đồng thời chúng tôi sẽ tạo một số ứng dụng tiêu dùng miễn phí để mở rộng tầm ảnh hưởng của thương hiệu và thu thập dữ liệu người dùng của bên thứ nhất.
Tùy chỉnh và khác biệt cho nhu cầu kinh doanh
Trong sáu tháng tới, các mô hình này sẽ được trang bị các mô hình nhúng ngữ nghĩa để tìm kiếm nội dung và các plugin đa phương thức để xử lý đầu vào trực quan. Các mô hình đặc biệt được đào tạo lại bằng cách sử dụng các nguồn dữ liệu chất lượng cao có sẵn trên thị trường cũng sẽ được chuẩn bị.
Quá trình phát triển thương mại sẽ bắt đầu đồng thời với quá trình phát triển loạt mô hình thế hệ đầu tiên: chúng tôi dự định sẽ tích hợp bằng chứng về khái niệm vào cuối quý đầu tiên của năm 2024.
Về công nghệ, trong quý 1 và quý 2 năm 2024, chúng tôi sẽ tập trung vào 2 lĩnh vực chính bị các công ty đi trước định giá thấp:
● Đào tạo một mô hình đủ nhỏ để chạy trên máy tính xách tay 16 GB đồng thời hoạt động như một trợ lý AI hữu ích
● Đào tạo các mô hình với ngữ cảnh bổ sung có thể hoán đổi nóng**, cho phép lên đến hàng triệu ngữ cảnh bổ sung, kết hợp hiệu quả các mô hình ngôn ngữ và hệ thống truy xuất.
Đồng thời, các bộ dữ liệu đào tạo và tinh chỉnh sẽ tiếp tục được làm giàu thông qua quan hệ đối tác và thu thập dữ liệu.
Đến cuối quý 2 năm 2024, chúng tôi dự định:
● Phân phối mô hình tạo văn bản mã nguồn mở tốt nhất, với đầu ra văn bản và hình ảnh
● Có mô hình chung và chuyên gia với một trong những tỷ lệ giá trị/chi phí cao nhất
● Cung cấp khả năng mô hình cho các nhà tích hợp bên thứ ba thông qua các API có sẵn đa dạng và có thể mở rộng
● Thiết lập mối quan hệ thương mại được cấp phép với một hoặc hai công ty lớn trong ngành đã cam kết sử dụng công nghệ của chúng tôi
Giai đoạn tiếp theo
Cạnh tranh và vượt qua những người chơi như OpenAI sẽ cần đầu tư đáng kể trong các giai đoạn sau (GPT-4 tiêu tốn vài trăm triệu đô la). Mục tiêu của chúng tôi trong năm đầu tiên là chứng minh rằng chúng tôi là một trong những đội mạnh nhất trong cuộc cạnh tranh AI toàn cầu, có thể phát triển và tung ra các mô hình có thể cạnh tranh với những người chơi lớn nhất. Kinh nghiệm của chúng tôi với tư cách là nhà nghiên cứu mô hình ngôn ngữ quy mô lớn (LLM) sẽ cho phép chúng tôi sử dụng vốn hiệu quả hơn ở giai đoạn đầu so với các công ty đang khám phá hoặc chuyển sang lĩnh vực này.
Một điểm nổi bật của mistral.ai sẽ là tính bảo mật: chúng tôi sẽ phát hành các mô hình theo cách được sắp xếp hợp lý, đảm bảo rằng các mô hình của chúng tôi chỉ được sử dụng cho các mục đích phù hợp với các giá trị của chúng tôi và vì điều này, chúng tôi sẽ cung cấp quyền truy cập beta cho "nhóm đỏ" phát hiện hành vi không phù hợp và sửa chữa chúng.
Khi làm như vậy, chúng tôi sẽ thuyết phục các tổ chức công và tư quan trọng rằng chúng tôi có thể xây dựng các công nghệ an toàn, có thể kiểm soát và hiệu quả, cho phép nhân loại hưởng lợi từ bước đột phá khoa học này. Và điều này sẽ thu hút các tổ chức và quốc gia tham gia tài trợ Series A của chúng tôi. Trong Series A (quý 3 năm 2024), chúng tôi dự kiến sẽ cần huy động 200 triệu đô la để đào tạo các mô hình ngoài khả năng của GPT-4.
Sự hỗ trợ tài chính mạnh mẽ sẽ cho phép chúng tôi đào tạo các mô hình trên cơ sở hạ tầng lớn hơn nhiều, củng cố vị thế của chúng tôi với tư cách là công ty dẫn đầu về nghiên cứu AI và nhà cung cấp được lựa chọn trong lĩnh vực công nghiệp châu Âu.
(toàn văn)
Xem bản gốc
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Bốn tuần sau khi thành lập, nó đã huy động được 105 triệu euro và toàn văn bản ghi nhớ tài chính của mô hình ngôn ngữ châu Âu mistral.ai
Nguồn: Trao quyền cho phòng thí nghiệm
Một nhóm chỉ mới thành lập được vài tuần đã hoàn thành khoản tài trợ 105 triệu euro mà không có sản phẩm, không có người dùng và không có kinh nghiệm vận hành. Bản ghi nhớ (memo) này đã giúp nó thuyết phục được Light Speed, cựu CEO Google Eric Schmidt và những người khác. Bản ghi nhớ nhấn mạnh thị trường châu Âu, bảo mật AI, tuân thủ và các khía cạnh khác, Mistral tin rằng việc họ sử dụng lộ trình nguồn mở hoàn toàn khác với OpenAI cuối cùng sẽ cho phép anh ta thiết lập lợi thế và đạt được thành tích vượt trội. Từ những gì tôi đọc được, bản ghi nhớ này rõ ràng được viết rất khéo léo, và nó cũng chứa một số yếu tố bịp bợm. Nó đã tận dụng tốt tâm lý FOMO hiện tại của xã hội châu Âu về mô hình ngôn ngữ lớn để hoàn thành việc tài trợ.
Mistral sẵn sàng chỉ một cơn gió lạnh tây bắc khô và mạnh ở miền nam nước Pháp, đồng thời nó cũng là tên của một loại tàu tấn công đổ bộ do Pháp sản xuất. Đây là tàu tấn công đổ bộ hàng đầu thế giới. Cái tên thể hiện niềm tự hào của người Pháp. Sáu thành viên của nhóm sáng lập đều đến từ Pháp, thay vì hiểu nó là một công ty người mẫu lớn nói tiếng Châu Âu, tôi lại nghĩ nó giống một công ty người mẫu lớn nói tiếng Pháp hơn. Anh ấy kể một câu chuyện châu Âu hay, nhưng nó sẽ không phải là câu chuyện duy nhất ở châu Âu.
mistral.ai Bản ghi chiến lược
Tác giả: mistral.ai
Dịch: ChatGPT, Wang Chao
Trí tuệ nhân tạo sáng tạo là một công nghệ biến đổi
Trong năm ngoái, chúng ta đã chứng kiến sự tăng tốc phi thường của AI tổng quát (các hệ thống có khả năng tạo văn bản/hình ảnh từ văn bản và hình ảnh). Những hệ thống này có thể giúp con người:
● Sản xuất nội dung xuất sắc và sáng tạo (văn bản, mã, đồ họa)
● Đọc, xử lý và tóm tắt các luồng nội dung phi cấu trúc nhanh hơn con người hàng nghìn lần
● Tương tác với thế giới thông qua ngôn ngữ tự nhiên hoặc API để thực thi quy trình công việc nhanh hơn bao giờ hết.
Các khả năng mạnh mẽ của AI tổng quát bất ngờ được tiết lộ cho công chúng sau khi phát hành ChatGPT. Những sản phẩm như vậy chỉ được sản xuất bởi một số nhóm nhỏ trên khắp thế giới và số lượng hạn chế các nhà nghiên cứu trong các nhóm này đã trở thành nút cổ chai ngăn cản việc tạo ra một nền kinh tế mới trong lĩnh vực này.
AI sáng tạo sắp tăng năng suất trong tất cả các ngành và tạo ra một ngành mới bằng cách liên tục tăng cường khả năng máy móc của trí óc con người (thị trường trị giá 10 tỷ USD vào năm 2022, dự kiến đạt 110 tỷ USD vào năm 2030, tốc độ tăng trưởng hàng năm dự kiến là 35%). Đó là một công nghệ biến đổi cho nền kinh tế thế giới sẽ thay đổi bản chất của công việc và mang lại thay đổi xã hội tích cực.
Độc quyền nhóm đang được hình thành
Các kỹ thuật AI sáng tạo dựa trên cơ sở nhiều năm nghiên cứu trong ngành và học viện. Bằng cách mở rộng quy mô đào tạo thành dữ liệu quy mô Internet và sửa mô hình bằng phản hồi của con người, những đột phá giúp công nghệ có thể tiếp cận được với đại chúng đã đạt được bởi một số ít người chơi trong ngành, trong đó lớn nhất (OpenAI) dường như có ý định bá chủ về thị trường.
Một số ít người chơi này đào tạo các mô hình tổng quát và sử dụng chúng làm tài sản; họ phục vụ hàng nghìn bên thứ ba, những người tạo ra sản phẩm để cải thiện năng suất, cũng như công chúng thông qua các sản phẩm của riêng họ như chatbot. Một số lượng lớn các công ty khởi nghiệp bên thứ ba vẫn đang được thành lập để xây dựng các dịch vụ khác nhau dựa trên các mô hình chung này.
**Chúng tôi tin rằng phần lớn giá trị trong thị trường AI tổng quát mới nổi đến từ công nghệ khó chế tạo, chính các mô hình tổng quát. **Những mô hình này cần được đào tạo trên hàng nghìn cỗ máy mạnh mẽ, xử lý hàng nghìn tỷ dữ liệu từ các nguồn chất lượng cao, tạo nên tiêu chuẩn cao đầu tiên. Rào cản quan trọng thứ hai là khó khăn trong việc xây dựng một đội ngũ giàu kinh nghiệm và mistral.ai đang ở một vị trí thuận lợi để làm điều này.
Hiện tại (GLM) tất cả các công ty lớn đều ở Mỹ, chưa có đối thủ cạnh tranh nghiêm trọng nào ở Châu Âu. Với mức độ mạnh mẽ (và nguy hiểm) của công nghệ mới này, đây là một câu hỏi địa chính trị lớn. mistral.ai sẽ dẫn đầu châu Âu về AI giúp tăng năng suất và khả năng sáng tạo, đồng thời định hướng cuộc cách mạng công nghiệp mới sắp tới.
AI thế hệ hiện tại không đáp ứng nhu cầu thị trường
OpenAI và các đối thủ cạnh tranh hiện tại của nó đã chọn con đường công nghệ khép kín, điều này sẽ hạn chế đáng kể mức độ bao phủ thị trường của họ. Theo cách tiếp cận này, mô hình được giữ ở chế độ riêng tư và chỉ được cung cấp thông qua API chuyển văn bản thành văn bản. Điều này đặt ra những câu hỏi quan trọng sau đây cho doanh nghiệp:
● Các tổ chức muốn sử dụng các kỹ thuật AI tổng quát buộc phải cung cấp dữ liệu kinh doanh có giá trị và dữ liệu nhạy cảm của người dùng cho một mô hình hộp đen, thường được triển khai trên đám mây công cộng. Điều này đặt ra một vấn đề bảo mật: không thể kiểm tra một mô hình được giữ bí mật để đảm bảo rằng đầu ra của nó an toàn và một mô hình như vậy không thể được triển khai trong một ứng dụng quan trọng về bảo mật. Tình huống này cũng làm nảy sinh các vấn đề pháp lý, đặc biệt là khi một công ty chuyển dữ liệu cá nhân ra ngoài ranh giới pháp lý của công ty, vốn có thể chịu sự điều chỉnh của luật pháp ngoài lãnh thổ.
● Chỉ hiển thị đầu ra của mô hình, thay vì mô hình đầy đủ, khiến việc giao tiếp với các thành phần khác (cơ sở dữ liệu truy xuất, đầu vào có cấu trúc, hình ảnh và âm thanh) trở nên khó khăn hơn. Hiện tại có hàng trăm sản phẩm tạo ra các khả năng tổng hợp (ví dụ: bộ nhớ, tầm nhìn, v.v.) bằng cách kết nối đầu ra và đầu vào của các mô hình với nhau. Những sản phẩm này sẽ hoạt động tốt hơn và nhanh hơn nếu mô hình có thể được cung cấp dưới dạng hộp trắng (mô hình trong suốt) (chẳng hạn như The Flamingo tích hợp mô hình hình ảnh và văn bản của hộp trắng thành mô hình văn bản+hình ảnh).
● Dữ liệu được sử dụng để đào tạo mô hình là bí mật, có nghĩa là chúng tôi dựa vào các hệ thống có nguồn gốc không chắc chắn và có thể tạo ra đầu ra không kiểm soát được. Các nỗ lực lọc để giải quyết vấn đề này chỉ cung cấp những đảm bảo yếu và mong manh rằng mô hình sẽ không xuất ra nội dung nhạy cảm mà nó có thể đã được đào tạo để thực hiện. Vấn đề này đã dẫn đến việc ChatGPT bị cấm ở Ý vào tháng 4 năm 2023.
Phá vỡ mô hình thị trường từ Châu Âu
Bằng cách thành lập mistral.ai, chúng tôi dự định có lập trường hoàn toàn trái ngược với các mô hình khép kín hiện tại để đào tạo các mô hình tiên tiến. **Tầm nhìn của chúng tôi là trở thành công ty hàng đầu trong lĩnh vực này đồng thời tích hợp các mô hình này ở Châu Âu và toàn ngành để phát triển một doanh nghiệp có giá trị cao. **
**mistral.ai sẽ dẫn đầu nghiên cứu về AI tổng hợp và trong vòng 4 năm tới sẽ là nhà cung cấp công nghệ AI hàng đầu trên thị trường. **Để đạt được mục tiêu này, trước tiên chúng tôi sẽ tập trung vào một vài đặc điểm khác biệt chính, sau đó tiến hành nỗ lực R&D toàn diện để chọn ra các chiến lược hiệu quả nhất nhằm hướng tới trí tuệ nhân tạo có giá trị thiết thực đối với con người.
Tập trung vào thị trường châu Âu trước tiên sẽ mang lại cho chúng tôi lợi thế phòng thủ và lập trường cởi mở của chúng tôi về lộ trình công nghệ sẽ nâng cao hơn nữa sức hấp dẫn của chúng tôi. Nhiều bộ óc thông minh nhất trong lĩnh vực Mô hình hóa ngôn ngữ lớn (LLM) là người châu Âu; kinh nghiệm sâu rộng của chúng tôi cho thấy rằng nhiều người trong số họ muốn tham gia dự án của chúng tôi.
Định vị kỹ thuật đối diện
Những điểm khác biệt ban đầu của chúng tôi, những điểm mù trong chiến lược của đối thủ cạnh tranh, là:
● **Thực hiện một cách tiếp cận cởi mở hơn để phát triển mô hình. **Chúng tôi sẽ phát hành mô hình này theo giấy phép phần mềm nguồn mở dễ dãi, giấy phép này sẽ về cơ bản vượt trội so với đối thủ. Chúng tôi sẽ phát hành các công cụ để khai thác sức mạnh của các mô hình hộp trắng này và tạo cộng đồng nhà phát triển xung quanh thương hiệu của chúng tôi. Cách tiếp cận này rất khác về mặt ý thức hệ so với OpenAI, điều này sẽ thu hút tốt hơn các nhà nghiên cứu hàng đầu và nó sẽ là một động lực thúc đẩy mạnh mẽ cho sự phát triển của dự án, bởi vì nó sẽ cung cấp cho rất nhiều nhà phát triển nhiệt tình ở hạ lưu mở cửa. Điều này sẽ tăng phạm vi phát triển kinh doanh của chúng tôi. Chúng tôi sẽ cân bằng chiến lược nguồn mở của mình với các lợi ích tài chính, dành riêng các mô hình mạnh mẽ và chuyên nghiệp nhất cho người dùng trả tiền.
○ Chúng tôi sẽ dành 1% quỹ cho các quỹ phi lợi nhuận chịu trách nhiệm phát triển cộng đồng nguồn mở.
● Cho dù là mã nguồn mở hay được cấp phép, nội bộ (kiến trúc và trọng số được đào tạo) của các mô hình của chúng tôi luôn mở cho khách hàng của chúng tôi. **Điều này sẽ cho phép tích hợp chặt chẽ hơn với quy trình công việc của khách hàng, nội dung của chúng có thể được đưa vào các phần khác nhau của mô hình sâu, thay vì để mọi thứ được đánh số tự động dưới dạng văn bản đầu vào, được đưa vào API hộp đen. **
● **Tăng cường tập trung vào nguồn gốc dữ liệu và kiểm soát dữ liệu. **Các mô hình của chúng tôi sẽ được đào tạo về nội dung dữ liệu chất lượng cao (không phải nội dung cóp nhặt) mà chúng tôi sẽ đàm phán thỏa thuận cấp phép. Điều này sẽ cho phép chúng tôi đào tạo các mô hình tốt hơn các mô hình hiện có như Llama. Bằng cách sử dụng các kỹ thuật tương tác sâu (chuyên gia kết hợp và mô hình tăng cường truy xuất), chúng tôi sẽ cung cấp cho các mô hình quyền truy cập nguồn dữ liệu tùy chọn: đối với người dùng cao cấp trả phí, các mô hình cụ thể có thể được dành riêng cho tài chính/pháp lý/v.v. (điều này giúp tăng hiệu suất đáng kể ). Sử dụng các kỹ thuật tương tự, mô hình của chúng tôi sẽ có thể cung cấp quyền truy cập dữ liệu khác biệt tức thì cho nhân viên có các quyền sở hữu trí tuệ khác nhau của công ty.
● **Cung cấp bảo mật và quyền riêng tư vô song. **Mô hình của chúng tôi sẽ có thể triển khai trong đám mây riêng và tùy chọn trực tiếp trên thiết bị, giảm thiểu hiệu quả các mối lo ngại về quyền riêng tư bằng cách loại bỏ các quy trình có khả năng gây vấn đề. Để đạt được mục tiêu này, chúng tôi sẽ hướng các nỗ lực R&D của mình vào việc đào tạo các mô hình nhỏ nhưng siêu hiệu quả, đề xuất hiệu quả các mô hình có tỷ lệ chất lượng/chi phí cao nhất trên thị trường. Chiến lược nguồn mở của chúng tôi cũng sẽ đảm bảo khả năng kiểm tra của các mô hình của chúng tôi khi được triển khai cho các ngành chính (đặc biệt là ngành y tế và kép).
Phát triển kinh doanh
Về mặt kinh doanh, chúng tôi sẽ cung cấp các mô-đun kỹ thuật có giá trị nhất cho ngành công nghiệp dịch vụ AI mới nổi và sử dụng AI tổng quát để thay đổi hoàn toàn quy trình kinh doanh. Chúng tôi sẽ đồng xây dựng các giải pháp tích hợp với các nhà tích hợp châu Âu và khách hàng công nghiệp, đồng thời nhận phản hồi vô cùng quý giá từ họ để trở thành công cụ chính cho tất cả các công ty muốn tận dụng AI ở châu Âu.
Tích hợp với các ngành dọc có thể có các hình thức thị trường khác nhau, bao gồm giấy phép truy cập đầy đủ vào các mô hình (bao gồm cả trọng lượng được đào tạo), chuyên môn hóa các mô hình dựa trên nhu cầu, hợp đồng thương mại với các nhà tích hợp/công ty tư vấn để xây dựng các giải pháp tích hợp đầy đủ. Như được trình bày chi tiết trong lộ trình của chúng tôi, chúng tôi sẽ khám phá và xác định các phương pháp tiếp cận tốt nhất khi công nghệ phát triển.
Làm thế nào để trở thành người dẫn đầu trong lĩnh vực AI
Đội bóng hàng đầu
Nhóm sáng lập bao gồm các nhà nghiên cứu hàng đầu trong lĩnh vực đã từng làm việc tại DeepMind và Meta, cũng như các doanh nhân nối tiếp giàu kinh nghiệm của Pháp và các nhà lãnh đạo công có ảnh hưởng.
● Arthur Mensch — Giám đốc điều hành — Nguyên Trưởng phòng khoa học nghiên cứu tại DeepMind, tác giả chính của một số đóng góp lớn cho LLM: Chinchilla, Retro, Flamingo
● Guillaume Lample — Nhà khoa học trưởng — Cựu nhà khoa học nghiên cứu cấp cao của Meta. Dẫn dắt dự án Llama, đóng góp lớn của Meta cho lĩnh vực mô hình ngôn ngữ lớn
● Timothée Lacroix — CTO — Cựu kỹ sư phần mềm tại Meta, trưởng nhóm kỹ thuật tại Llama
● Jean-Charles Samuelian,Alan Giám đốc điều hành
● Charles Gorintin,Alan CTO
● Cédric O, cựu Bộ trưởng Ngoại giao Pháp về các vấn đề kỹ thuật số
Năm nhân viên đầu tiên đã được xác định sẽ là các nhà nghiên cứu có kinh nghiệm từ các công ty công nghệ lớn. Sự nhiệt tình của họ đối với châu Âu và khái niệm về nguồn mở, cũng như việc tái cơ cấu tổ chức liên tục của một số công ty do sự phát triển nhanh chóng của trí tuệ nhân tạo AI, cũng là thời điểm thích hợp để họ rời khỏi các công ty này.
Cơ sở hạ tầng và nguồn dữ liệu
Để đào tạo một mô hình cạnh tranh, một cụm quy mô cũ cần được sử dụng trong ít nhất vài tháng. Chúng tôi dự định thuê các tài nguyên máy tính như vậy trong cả năm, từ đó phát triển các mô hình mã nguồn mở và thương mại với các khả năng khác nhau.
Chúng tôi đã tiến hành đàm phán cạnh tranh với các nhà cung cấp dịch vụ đám mây hàng đầu về việc thuê tài nguyên máy tính (chúng tôi dự định bắt đầu vào mùa hè và hình thành dự trữ máy tính 1536 H100 vào tháng 9). Vì mistral.ai có nền tảng vững chắc ở châu Âu nên chúng tôi cũng sẽ hợp tác với các nhà cung cấp dịch vụ đám mây mới nổi ở châu Âu đang tích cực mở rộng các dịch vụ điện toán học sâu.
Chúng tôi đã đào tạo các mô hình quy mô lớn trước đây, điều này cung cấp cho chúng tôi kiến thức chuyên môn để đào tạo nhanh hơn 10-100 lần so với các phương pháp có sẵn công khai - những người sáng lập và nhân viên ban đầu của chúng tôi biết rõ cách đào tạo mô hình mạnh nhất với ngân sách tính toán nhất định.
Các nhà đầu tư ban đầu của chúng tôi cũng là nhà cung cấp nội dung ở Châu Âu và sẽ mở ra tất cả các cánh cửa cần thiết để chúng tôi có được bộ dữ liệu chất lượng cao mà chúng tôi có thể đào tạo và tinh chỉnh các mô hình của mình.
Khám phá các kịch bản cùng với các khách hàng quan trọng
Nhóm sáng lập đã tổ chức các cuộc thăm dò thương mại với các tổ chức thương mại lớn của Pháp và Châu Âu. Một nhóm nhỏ định hướng sản phẩm (6 người vào cuối năm) sẽ bắt đầu phát triển doanh nghiệp trong khi nhóm kỹ thuật đào tạo các mô-đun kỹ thuật có giá trị.
Nhóm người mẫu sẽ vẫn tập trung 100% vào việc phát triển công nghệ để tránh bị phân tâm.
Việc phát triển kinh doanh sẽ bắt đầu đồng thời với sự phát triển của dòng mô hình thế hệ đầu tiên, sử dụng các chiến lược sau:
● Tập trung khám phá nhu cầu của những người chơi công nghiệp lớn, được hỗ trợ bởi các nhà tích hợp bên thứ 3, những người sẽ được cấp quyền truy cập đầy đủ vào các mô hình (không phải nguồn mở) tốt nhất của chúng tôi
● Đồng thiết kế sản phẩm với một số đối tác nhỏ mới nổi tập trung vào các sản phẩm AI sáng tạo.
Khám phá dựa trên kinh doanh sẽ được sử dụng để thúc đẩy thiết kế của mô hình thế hệ thứ hai.
bản đồ tuyến đường
năm đầu tiên
Chúng tôi sẽ đào tạo hai thế hệ người mẫu, đồng thời phát triển mô hình và tích hợp thương mại. Thế hệ đầu tiên sẽ là nguồn mở một phần, dựa trên công nghệ mà nhóm đã thành thạo. Nó sẽ xác nhận khả năng của chúng tôi trong việc đáp ứng nhu cầu của khách hàng, nhà đầu tư và tổ chức của chúng tôi. Mô hình thế hệ thứ hai sẽ giải quyết những thiếu sót đáng kể của mô hình hiện tại, cho phép các doanh nghiệp sử dụng nó một cách an toàn và tiết kiệm.
Đào tạo mô hình tiêu chuẩn mã nguồn mở tốt nhất
Đến cuối năm 2023, chúng tôi sẽ đào tạo một loạt mô hình tạo văn bản có thể vượt trội đáng kể so với ChatGPT 3.5 và phiên bản Bard tháng 3 năm 2023, cũng như tất cả các giải pháp nguồn mở.
Sê-ri này sẽ là mã nguồn mở; chúng tôi sẽ tham gia vào cộng đồng để xây dựng dựa trên nó, làm cho nó trở thành một tiêu chuẩn mở.
Chúng tôi sẽ cung cấp giao diện dịch vụ giống như các đối thủ cạnh tranh của mình và tính phí thu thập dữ liệu sử dụng của bên thứ ba, đồng thời chúng tôi sẽ tạo một số ứng dụng tiêu dùng miễn phí để mở rộng tầm ảnh hưởng của thương hiệu và thu thập dữ liệu người dùng của bên thứ nhất.
Tùy chỉnh và khác biệt cho nhu cầu kinh doanh
Trong sáu tháng tới, các mô hình này sẽ được trang bị các mô hình nhúng ngữ nghĩa để tìm kiếm nội dung và các plugin đa phương thức để xử lý đầu vào trực quan. Các mô hình đặc biệt được đào tạo lại bằng cách sử dụng các nguồn dữ liệu chất lượng cao có sẵn trên thị trường cũng sẽ được chuẩn bị.
Quá trình phát triển thương mại sẽ bắt đầu đồng thời với quá trình phát triển loạt mô hình thế hệ đầu tiên: chúng tôi dự định sẽ tích hợp bằng chứng về khái niệm vào cuối quý đầu tiên của năm 2024.
Về công nghệ, trong quý 1 và quý 2 năm 2024, chúng tôi sẽ tập trung vào 2 lĩnh vực chính bị các công ty đi trước định giá thấp:
● Đào tạo một mô hình đủ nhỏ để chạy trên máy tính xách tay 16 GB đồng thời hoạt động như một trợ lý AI hữu ích
● Đào tạo các mô hình với ngữ cảnh bổ sung có thể hoán đổi nóng**, cho phép lên đến hàng triệu ngữ cảnh bổ sung, kết hợp hiệu quả các mô hình ngôn ngữ và hệ thống truy xuất.
Đồng thời, các bộ dữ liệu đào tạo và tinh chỉnh sẽ tiếp tục được làm giàu thông qua quan hệ đối tác và thu thập dữ liệu.
Đến cuối quý 2 năm 2024, chúng tôi dự định:
● Phân phối mô hình tạo văn bản mã nguồn mở tốt nhất, với đầu ra văn bản và hình ảnh
● Có mô hình chung và chuyên gia với một trong những tỷ lệ giá trị/chi phí cao nhất
● Cung cấp khả năng mô hình cho các nhà tích hợp bên thứ ba thông qua các API có sẵn đa dạng và có thể mở rộng
● Thiết lập mối quan hệ thương mại được cấp phép với một hoặc hai công ty lớn trong ngành đã cam kết sử dụng công nghệ của chúng tôi
Giai đoạn tiếp theo
Cạnh tranh và vượt qua những người chơi như OpenAI sẽ cần đầu tư đáng kể trong các giai đoạn sau (GPT-4 tiêu tốn vài trăm triệu đô la). Mục tiêu của chúng tôi trong năm đầu tiên là chứng minh rằng chúng tôi là một trong những đội mạnh nhất trong cuộc cạnh tranh AI toàn cầu, có thể phát triển và tung ra các mô hình có thể cạnh tranh với những người chơi lớn nhất. Kinh nghiệm của chúng tôi với tư cách là nhà nghiên cứu mô hình ngôn ngữ quy mô lớn (LLM) sẽ cho phép chúng tôi sử dụng vốn hiệu quả hơn ở giai đoạn đầu so với các công ty đang khám phá hoặc chuyển sang lĩnh vực này.
Một điểm nổi bật của mistral.ai sẽ là tính bảo mật: chúng tôi sẽ phát hành các mô hình theo cách được sắp xếp hợp lý, đảm bảo rằng các mô hình của chúng tôi chỉ được sử dụng cho các mục đích phù hợp với các giá trị của chúng tôi và vì điều này, chúng tôi sẽ cung cấp quyền truy cập beta cho "nhóm đỏ" phát hiện hành vi không phù hợp và sửa chữa chúng.
Khi làm như vậy, chúng tôi sẽ thuyết phục các tổ chức công và tư quan trọng rằng chúng tôi có thể xây dựng các công nghệ an toàn, có thể kiểm soát và hiệu quả, cho phép nhân loại hưởng lợi từ bước đột phá khoa học này. Và điều này sẽ thu hút các tổ chức và quốc gia tham gia tài trợ Series A của chúng tôi. Trong Series A (quý 3 năm 2024), chúng tôi dự kiến sẽ cần huy động 200 triệu đô la để đào tạo các mô hình ngoài khả năng của GPT-4.
Sự hỗ trợ tài chính mạnh mẽ sẽ cho phép chúng tôi đào tạo các mô hình trên cơ sở hạ tầng lớn hơn nhiều, củng cố vị thế của chúng tôi với tư cách là công ty dẫn đầu về nghiên cứu AI và nhà cung cấp được lựa chọn trong lĩnh vực công nghiệp châu Âu.
(toàn văn)