Lưu trữ cho từ khóa: AI

Midjourney là gì và làm cách nào để sử dụng nó để tạo ra tác phẩm nghệ thuật AI?

Khám phá Midjourney là gì và tìm hiểu những điều cần thiết khi sử dụng công cụ AI cải tiến này để tạo ra những tác phẩm nghệ thuật tuyệt đẹp và độc đáo.

Midjourney là một nền tảng hỗ trợ trí tuệ nhân tạo (AI) tổng hợp cho phép người dùng tạo ra các tác phẩm nghệ thuật độc đáo như nhân vật, hình ảnh và mô tả thông qua các lời nhắc bằng văn bản ngắn.

Nền tảng AI tổng quát là một hệ thống trí tuệ nhân tạo có thể tạo ra nội dung mới và độc đáo, thường ở dạng hình ảnh, văn bản hoặc các sản phẩm sáng tạo khác. Không giống như các hệ thống AI dựa trên quy tắc truyền thống được thiết kế cho các nhiệm vụ cụ thể, nền tảng AI tổng quát sử dụng các thuật toán nâng cao, thường dựa trên các kỹ thuật học sâu , để tự động tạo ra các kết quả đầu ra mới và phù hợp với ngữ cảnh.

Midjourney AI là một trong những nền tảng AI mang tính sáng tạo, mở ra những khả năng mới để thể hiện sáng tạo và có thể tạo ra kết quả vượt xa những gì đã được lập trình rõ ràng, đưa yếu tố khó đoán và sáng tạo vào bối cảnh AI. Điều này có thể được áp dụng cho nhiều lĩnh vực nghệ thuật khác nhau để tạo ra những hình ảnh chân thực không tồn tại trong thế giới thực.

Bài viết này thảo luận về Midjourney AI là gì, Midjourney hoạt động như thế nào, lời nhắc hiệu quả, Midjourney khác với Dall-E 2 như thế nào và lợi ích của tác phẩm nghệ thuật Midjourney. Nó cũng sẽ đặt ra câu hỏi còn sót lại: Việc sử dụng nghệ thuật do AI tạo ra có hợp đạo đức không? Ngoài ra còn có hướng dẫn từng bước về cách sử dụng Midjourney dành cho các nghệ sĩ để tạo ra các tác phẩm nghệ thuật độc đáo do AI tạo ra.

AI giữa hành trình là gì?

Midjourney là một chương trình và dịch vụ AI tổng hợp của phòng thí nghiệm nghiên cứu Midjourney, Inc. Nhóm Midjourney do David Holz, người đồng sáng lập của Leap Motion, lãnh đạo. Giống như DALL-E của OpenAI và Stable Diffusion của AI ổn định, Midjourney tạo ra hình ảnh bằng cách sử dụng mô tả ngôn ngữ tự nhiên được gọi là lời nhắc.

Trang web của Midjourney tự mô tả mình là “một phòng thí nghiệm nghiên cứu độc lập khám phá những phương tiện tư duy mới và mở rộng sức mạnh tưởng tượng của loài người”.

Nó đã ở giai đoạn thử nghiệm mở kể từ ngày 12 tháng 7 năm 2022 và người dùng có thể tạo tác phẩm nghệ thuật chất lượng cao với Midjourney bằng cách sử dụng lời nhắc dựa trên văn bản đơn giản trong lệnh bot Discord. Không cần phần cứng hoặc phần mềm chuyên dụng để sử dụng Midjourney. Tuy nhiên, để truy cập dịch vụ, cần phải có tài khoản Discord.

Midjourney hoạt động như thế nào?

Midjourney hoạt động thông qua sự tương tác tinh vi của hai công nghệ máy học: mô hình ngôn ngữ lớn và mô hình phổ biến. Khi người dùng nhập lời nhắc, một mô hình ngôn ngữ lớn sẽ giải mã nghĩa của các từ và biến nó thành một vectơ số.

Vectơ này đóng vai trò then chốt trong việc hướng dẫn quá trình khuếch tán, trong đó Midjourney sử dụng mô hình khuếch tán để biến tiếng ồn ngẫu nhiên thành tác phẩm nghệ thuật hấp dẫn về mặt thị giác. Các mô hình khuếch tán liên quan đến việc thêm dần nhiễu ngẫu nhiên vào tập dữ liệu hình ảnh huấn luyện . Mô hình này trở nên thành thạo trong việc tạo ra các hình ảnh hoàn toàn mới bằng cách học cách đảo ngược nhiễu này theo thời gian.

Ví dụ: nếu người dùng nhập lời nhắc văn bản chẳng hạn như “ Khai thác Bitcoin với màu sắc tươi sáng và giao diện hoạt hình”, Midjourney sẽ bắt đầu bằng một trường nhiễu hình ảnh. Thông qua sự khuếch tán tiềm ẩn, một mô hình AI được đào tạo sẽ loại bỏ nhiễu một cách có hệ thống, dần dần tiết lộ hình ảnh thể hiện bản chất của các đối tượng và chủ đề được chỉ định trong lời nhắc ban đầu.

Sức mạnh tổng hợp của mô hình khuếch tán và hiểu ngôn ngữ cho phép Midjourney tạo ra các tác phẩm nghệ thuật đa dạng và hấp dẫn do AI tạo ra dựa trên đầu vào hoặc lời nhắc của người dùng.

Cách bắt đầu với Midjourney – Hướng dẫn từng bước

Bản beta giữa hành trình chỉ có thể được truy cập thông qua tài khoản Discord. Dưới đây là hướng dẫn từng bước về cách sử dụng Midjourney để tạo các hình ảnh độc đáo do AI tạo ra:

Bước 1: Tham gia Midjourney Discord

Người dùng Discord hiện tại có thể truy cập Midjourney.com, nhấp vào nút “Tham gia bản Beta” hoặc truy cập trực tiếp vào Midjourney Discord . Đối với những người chưa có tài khoản Discord, hãy đăng ký tạo tài khoản miễn phí trên Discord trước rồi tham gia máy chủ Midjourney Discord. Bạn có thể truy cập Midjourney Discord từ mọi nơi – ứng dụng web, thiết bị di động và máy tính để bàn.

Bước 2: Chọn gói thuê bao

Khi dịch vụ này ra mắt lần đầu tiên vào tháng 7 năm 2022, bất kỳ ai cũng có thể sử dụng nó để tạo 25 hình ảnh miễn phí. Tuy nhiên, điều này đã thay đổi vào tháng 4 năm 2023 khi Midjourney tạm dừng chương trình dùng thử miễn phí. Midjourney không còn được cung cấp miễn phí ngoại trừ một số thời gian khuyến mại ngắn hạn. Kế hoạch giá có thể được tìm thấy trong bảng dưới đây.

Bước 3: Sử dụng lệnh “/imagine” để tạo tác phẩm nghệ thuật

Để bắt đầu, bạn có thể truy cập kênh “#newbies”, theo sau là một số trên máy chủ Midjourney Discord. Có rất nhiều kênh như vậy và bạn có thể chọn bất kỳ kênh nào trong số đó. Trong kênh dành cho người mới bắt đầu, hãy nhập “/” theo sau là “tưởng tượng” và lời nhắc để Midjourney tạo các hình ảnh được yêu cầu.

Ví dụ: /imagine gợi ý: “ Khai thác bitcoin có màu sắc tươi sáng với hình thức hoạt hình”.

Một ví dụ khác về lời nhắc /imagine, “ Các yếu tố chuỗi khối Ethereum trong môi trường công nghệ hiện đại,” đã cho kết quả như sau:

Mất bao lâu để Midjourney tạo ra một hình ảnh?

Trung bình, Midjourney mất khoảng một phút để tạo ra bốn tùy chọn tác phẩm nghệ thuật. Tuy nhiên, điều này không cố định và thời gian có thể tăng lên nếu người ta muốn hình ảnh được nâng cấp hoặc đầu ra có tỷ lệ khung hình không vuông.

Gói đăng ký giữa hành trình có các chế độ nhanh và thoải mái, điều này sẽ thay đổi tốc độ tạo theo gói đã đăng ký. Ở chế độ nhanh, việc xếp hàng chờ sau người khác là không cần thiết. Tuy nhiên, ngay cả những gói trả phí đắt nhất cũng có giới hạn hàng tháng về số lượng hình ảnh được tạo ở chế độ nhanh.

Ở chế độ thoải mái, các yêu cầu hình ảnh sẽ được gửi đến hàng đợi. Quá trình tạo có thể mất từ một đến 10 phút để hoàn thành. Ngoài ra, Midjourney còn có chế độ “Turbo” đắt tiền có thể được kích hoạt bằng lệnh “/ turbo”. Chế độ Turbo tạo ra hình ảnh mới nhanh hơn bốn lần nhưng tiêu tốn gấp đôi thời gian so với mức cho phép hàng tháng của gói đăng ký của bạn.

Làm cách nào để lưu hình ảnh Midjourney và ai sở hữu chúng?

Để lưu hình ảnh được tạo trên Midjourney, hãy nhấp vào hình ảnh để mở ở kích thước đầy đủ, sau đó nhấp chuột phải và chọn tùy chọn “Save image”. Trên thiết bị di động, nhấn và giữ vào hình ảnh rồi nhấn vào biểu tượng tải xuống ở góc trên cùng bên phải.

Midjourney cho phép người dùng xem tất cả các hình ảnh đã tạo trước đó, bao gồm cả lời nhắc được sử dụng để tạo chúng. Để truy cập các hình ảnh Midjourney đã tạo trước đó trên Discord, hãy chuyển đến tab “Đề cập” của Hộp thư đến Discord và tải xuống các hình ảnh trước đó.

Hình ảnh giữa hành trình thuộc phạm vi công cộng và quyền sở hữu là nguồn mở. Midjourney tựmô tả mình là một cộng đồng mở cho phép người khác sử dụng và phối lại các hình ảnh cũng như lời nhắc khi được đăng ở chế độ công khai. Theo mặc định, tất cả hình ảnh trên Midjourney đều có thể xem và phối lại công khai. Vì vậy, chúng có thể được truy cập và sửa đổi bởi bất kỳ ai. Điều này khiến việc bán tác phẩm nghệ thuật Midjourney trở nên đáng nghi ngờ.

Sự khác biệt giữa Midjourney và Dall-E 2 là gì?

Dall-E 2 là mô hình chuyển văn bản thành hình ảnh và là phiên bản kế thừa của Dall-E được xây dựng bởi phòng thí nghiệm nghiên cứu OpenAI đã ra mắt ChatGPT. Năm 2019, OpenAI đã nhận được hơn 1 tỷ USD tài trợ từ Microsoft và Khosla Ventures. Vào tháng 1 năm 2023, sau khi ra mắt Dall-E 2 và ChatGPT, OpenAI đã nhận được thêm 10 tỷ USD tài trợ từ Microsoft. Midjourney được tự tài trợ và xây dựng bởi một phòng thí nghiệm độc lập, Midjourney Inc.

Trong khi Dall-E 2 và Midjourney dựa trên mô tả ngôn ngữ tự nhiên tạo ra hình ảnh từ lời nhắc, việc sử dụng tùy thuộc vào yêu cầu và sở thích cụ thể. Một số khác biệt như sau:

  • Quyền truy cập: Midjourney có thể được truy cập thông qua Discord, trong khi Dall-E 2 chỉ khả dụng qua trang web của OpenAI.
  • Độ phân giải hình ảnh: Midjourney có thể tạo ra hình ảnh có độ phân giải 1792×1024, trong khi Dall-E 2 tạo ra độ phân giải 1024×1024.
  • Đăng ký: Cả hai đều có gói đăng ký và người dùng có thể kiểm tra mức giá cập nhật trên các trang web tương ứng để xem gói nào phù hợp nhất với họ.

Lợi ích và tận dụng Midjourney

Midjourney đã cho phép các nghệ sĩ khám phá nhiều phong cách, chủ đề và khái niệm nghệ thuật khác nhau, thúc đẩy sự sáng tạo và vượt qua ranh giới của các loại hình nghệ thuật truyền thống. Các nghệ sĩ có thể thử nghiệm nhiều tham số và kỹ thuật, tạo ra các sản phẩm linh hoạt, từ các tác phẩm trừu tượng đến các hình ảnh thể hiện thực tế. Tiết kiệm thời gian nhờ khả năng quay vòng AI nhanh chóng để tạo hình ảnh.

Hơn nữa, việc tích hợp với các nền tảng như Discord sẽ nâng cao các khía cạnh hợp tác của Midjourney, cho phép các nghệ sĩ chia sẻ ý tưởng, kỹ thuật và sáng tạo trong cộng đồng những cá nhân có cùng chí hướng.

Bên cạnh sự thể hiện nghệ thuật, Midjourney còn có lợi cho việc tạo hình ảnh sản phẩm, hình minh họa, quảng cáo trên mạng xã hội, tài sản tiếp thị,dự án nghệ thuật mã thông báo không thể thay thế (NFT) , hình ảnh kiến trúc, v.v.

Nghệ thuật AI có hợp pháp và đạo đức không?

Mặc dù nghệ thuật AI là hợp pháp nhưng ý nghĩa đạo đức của nó rất đa dạng và liên quan đến những cân nhắc liên quan đến tính sáng tạo, quyền sở hữu, thành kiến và tác động xã hội. Tranh cãi chung là mặc dù các công cụ AI góp phần tạo nên sự sáng tạo nhưng đầu vào và hướng dẫn lại đến từ con người. Hướng dẫn rõ ràng về phân bổ và quyền sở hữu là điều cần thiết để giải quyết những vấn đề này.

Việc sử dụng thương mại các tác phẩm nghệ thuật do AI tạo ra đặt ra câu hỏi về sự đền bù công bằng và khả năng đạo văn. Các nghệ sĩ nên nhận thức được ý nghĩa đạo đức của việc bán tác phẩm do AI tạo ra và cách nó phù hợp với các chuẩn mực đã được thiết lập trong thế giới nghệ thuật.

Các mô hình AI được đào tạo trên các tập dữ liệu có thể mang những thành kiến có trong dữ liệu – thành kiến về giới tính, chủng tộc hoặc văn hóa. Điều này vô tình có thể dẫn đến những kết quả đầu ra sai lệch, củng cố những khuôn mẫu hoặc định kiến hiện có. Các nghệ sĩ và nhà phát triển cần phải nhận thức được những thành kiến này và nỗ lực giảm thiểu chúng.

Các tài nguyên tính toán cần thiết để đào tạo và chạy các mô hình AI tiên tiến như Midjourney và Dall-E 2 gây ra những lo ngại về môi trường. Diễn ngôn về đạo đức nên xem xét lượng khí thải carbon liên quan đến các hoạt động AI quy mô lớn.

Tổng hợp và chỉnh sửa: ThS Phạm Mạnh Cường
Theo CoinTelegraph

OpenAI công bố vòng thứ hai của quỹ khởi nghiệp AI

OpenAI cho biết sáng kiến quỹ khởi nghiệp là cách giúp vượt qua ranh giới của AI ứng dụng trong các lĩnh vực thiết yếu.

OpenAI đã mở đơn đăng ký cho nhóm thứ hai trong chương trình kéo dài sáu tuần dành cho các công ty khởi nghiệp trí tuệ nhân tạo (AI) , Converge 2, qua đó họ sẽ đầu tư 1 triệu USD vào mỗi người trong số 15 người tham gia thành công được chọn.

Tổ chức đằng sau ChatGPT đã thông báo rằng sáng kiến này có thể truy cập được trên toàn thế giới, nhằm vào các cá nhân như kỹ sư, nhà thiết kế, nhà nghiên cứu và nhà xây dựng sản phẩm sử dụng AI cho mục đích đổi mới. OpenAI thành lập quỹ khởi nghiệp với ý tưởng rằng các hệ thống AI mạnh mẽ sẽ thúc đẩy một kỷ nguyên mới của các công ty khởi nghiệp đột phá.

Sự phổ biến nhanh chóng của các công cụ và giải pháp AI đã thu hút được sự ủng hộ từ các chuyên gia trong ngành cũng như các nhà đầu tư. Các công ty khởi nghiệp AI sáng tạo đã nhận được nguồn tài trợ đáng kể từ nhiều công ty và tổ chức khác nhau chỉ trong năm 2023.

Vào tháng 11 năm 2022, OpenAI đã khởi xướng giai đoạn đầu tiên của quỹ khởi nghiệp để hỗ trợ các nhà sáng lập và công ty có tham vọng tạo ra các sản phẩm AI đổi mới. Nó cung cấp khoản đầu tư 1 triệu USD cho mỗi công ty khởi nghiệp trong số 12 công ty khởi nghiệp được chọn từ nhóm ứng viên.

Công bố chương trình thông qua một tuyên bố được chia sẻ bởi Giám đốc điều hành Sam Altman, OpenAI đã giải thích nền tảng của sáng kiến này và tác động của nó đối với AI. Công ty tuyên bố rằng sáng kiến quỹ khởi nghiệp là OpenAI đang thực hiện vai trò của mình để giúp vượt qua ranh giới của AI ứng dụng trong các lĩnh vực thiết yếu.

Công ty cho biết tuần đầu tiên và tuần cuối cùng của chương trình sẽ diễn ra tại San Francisco, với OpenAI chi trả chi phí đi lại cho người tham gia.

Công ty cũng khuyến khích những người sáng lập có nguồn gốc khác nhau nộp đơn, bất kể vị trí của họ bên ngoài Hoa Kỳ hay mức độ kinh nghiệm. Nó nhấn mạnh rằng kinh nghiệm trước đây với hệ thống AI không phải là một yêu cầu bắt buộc.

Thời gian đăng ký bắt đầu từ ngày 13 tháng 12 năm 2023 đến ngày 26 tháng 1 năm 2024.

Kasikornbank, một ngân hàng tư nhân ở Thái Lan, cũng giới thiệu quỹ sơ cấp trị giá 100 triệu USD, KXVC, để đầu tư vào AI, Web3 và các công ty khởi nghiệp công nghệ sâu, đặc biệt tập trung vào khu vực châu Á – Thái Bình Dương.

Trong khi đó, công ty khởi nghiệp AI Mistral AI của Pháp tiết lộ việc huy động được 415 triệu USD trong vòng cấp vốn gần đây, kết thúc vào ngày 1 tháng 12. Vòng cấp vốn do Andreessen Horowitz dẫn đầu, cùng với sự hỗ trợ từ những người ủng hộ ban đầu của công ty khởi nghiệp, Lightspeed Ventures.

Tổng hợp và chỉnh sửa: ThS Phạm Mạnh Cường
Theo CoinTelegraph

a16z tiết lộ kế hoạch vận động hành lang: Ném tiền vào các chính trị gia tiên phong về công nghệ

Ben Horowitz, một trong những người sáng lập của công ty, đã cam kết hỗ trợ bất kỳ chính trị gia nào giúp thúc đẩy công nghệ tiền điện tử và AI phát triển.

Công ty đầu tư mạo hiểm Andreessen Horowitz (a16z) hy vọng sẽ thúc đẩy quy định về tiền điện tử và trí tuệ nhân tạo (AI) với một chiến lược dường như mới: ném tiền vào các chính trị gia.

“Nếu một ứng viên ủng hộ một tương lai lạc quan được hỗ trợ bởi công nghệ, thì chúng tôi ủng hộ họ. Nếu họ muốn bóp nghẹt các công nghệ quan trọng, chúng tôi sẽ chống lại họ,” Ben Horowitz, một trong những người sáng lập công ty, viết trong một bài đăng ngày 14 tháng 12 và nói thêm:

“Mỗi xu chúng tôi quyên góp sẽ được dùng để hỗ trợ những ứng cử viên có cùng chí hướng và phản đối những ứng cử viên có mục đích tiêu diệt tương lai công nghệ tiên tiến của Mỹ.”

Horowitz cho biết đây sẽ là “lần đầu tiên” a16z theo đuổi con đường vận động hành lang để thúc đẩy các chính trị gia thân thiện với công nghệ. Tuy nhiên, trước đó nó đã tổ chức một buổi gây quỹ cho một đại diện ở New York vào tháng 10 năm 2022, theo Forbes.

Đặc biệt, Horowitz đã nhấn mạnh các công nghệ dựa trên blockchain và AI là hai công nghệ có thể tạo nên một thế giới tốt đẹp hơn.

Horowitz cho biết, các công nghệ phi tập trung “sẽ tạo ra một nền kinh tế công bằng hơn, toàn diện hơn” so với những gì mà các công ty Big Tech tập trung đã đạt được, trong khi AI “có tiềm năng nâng tầm toàn nhân loại” lên một mức sống chưa từng có trước đây.

Avalanche, Coinbase, Dapper Labs, Lido Finance, Nansen, OpenSea, Uniswap và Worldcoin là một số công ty khởi nghiệp về tiền điện tử mà a16z đã đầu tư.

Horowitz nhấn mạnh rằng ông không hoàn toàn chống lại quy định: “Quy định chất lượng cao có thể giúp một ngành phát triển mạnh đồng thời bảo vệ người tiêu dùng”, nhưng hết lần này đến lần khác, chúng ta đã chứng kiến “quy định chính trị hóa” giết chết các ngành công nghiệp, ông nói.

“Những ngày tươi đẹp nhất của nước Mỹ đang ở phía trước nếu chúng ta duy trì được vị thế dẫn đầu về công nghệ toàn cầu. Điều đầu tiên có thể làm suy yếu điều đó là chính sách quản lý sai lầm.”

Horowitz cho biết các công ty Big Tech đã có đại diện tốt ở Washington, DC, nhưng quan tâm đến việc “duy trì sự độc quyền của họ” hơn là ủng hộ quy định công bằng .

Công ty đầu tư tập trung vào công nghệ này đã viết “tuyên ngôn lạc quan về công nghệ” của riêng mình vào tháng 10, điều này đã thu hút sự chỉ trích từ khắp nơi vì đã chia sẻ một số ý kiến xa vời.

Một trong những ý kiến của a16z là “bất kỳ sự giảm tốc nào của AI [theo quy định] sẽ phải trả giá bằng mạng sống.”

Nhà báo chuyên mục tài chính Jemima Kelly của Financial Times là một trong số nhiều người không đồng ý, cho rằng “chủ nghĩa tăng tốc” công nghệ không bị hạn chế là một ý tưởng tồi.

Hơn 2.600 nhà lãnh đạo và nhà nghiên cứu công nghệ, chẳng hạn như Giám đốc điều hành Tesla Elon Musk và đồng sáng lập Apple Steve Wozniak, đã ký một bản kiến nghị “tạm dừng” phát triển AI vào tháng 3 năm 2023, chia sẻ lo ngại rằng AI gây ra “rủi ro sâu sắc cho xã hội và nhân loại”.

Tổng hợp và chỉnh sửa: ThS Phạm Mạnh Cường
Theo CoinTelegraph

Gemini của Google, ChatGPT của OpenAI đối đầu trong thử nghiệm Cointelegraph

Các so sánh giữa Gemini của Google và ChatGPT của OpenAI tiếp tục tràn ngập các không gian xã hội trên Internet, vì vậy chúng tôi quyết định thử nghiệm chúng bằng các câu hỏi của riêng mình.

Vào ngày 6 tháng 12, Google đã ra mắt mô hình trí tuệ nhân tạo (AI) mới nhất của mình, Gemini , được hãng tuyên bố là mô hình tiên tiến nhất hiện có trên thị trường – thậm chí còn tốt hơn mô hình phổ biến do OpenAI phát triển, ChatGPT-4.

Tuyên bố táo bạo này được các nhà điều tra cộng đồng trên internet coi như một thách thức, những người đã nhanh chóng chuyển sang kiểm tra các phương pháp và tiêu chuẩn được Google sử dụng để khẳng định tính ưu việt được cho là của Gemini và chế giễu hoạt động tiếp thị sản phẩm của công ty.

David Gull, Giám đốc điều hành của công ty khởi nghiệp chăm sóc sức khỏe được hỗ trợ bởi AI Vital, nói với Cointelegraph rằng mỗi mô hình, có thể là ChatGPT-4, Llama 2 hoặc bây giờ là Gemini, đều có những điểm mạnh và thách thức riêng.

“Khi khám phá thế giới khởi nghiệp AI, việc chọn mô hình ngôn ngữ phù hợp là chìa khóa thành công cho sản phẩm của bạn. Với việc Google giới thiệu mô hình Gemini AI, các tùy chọn LLM [mô hình ngôn ngữ lớn] của chúng tôi đã mở rộng đáng kể.”

Ông cho biết thêm, hiện tại, mô hình ChatGPT-4 của OpenAI nổi bật với “ứng dụng rộng rãi trong thế giới thực”, cùng với các biện pháp an toàn nâng cao.

Gull cho biết khi các doanh nghiệp hiện đang “đi sâu vào” Gemini, mục tiêu tốt sẽ là “đạt được sự cân bằng giữa hiệu suất và khả năng tùy chỉnh” phù hợp với sứ mệnh và giá trị của công ty cũng như mang lại trải nghiệm tốt nhất cho người dùng.

Cointelegraph đã quyết định đưa hai mô hình này vào thử nghiệm, hỏi cả Gemini (thông qua Bard) và ChatGPT-4 những câu hỏi giống nhau và so sánh các câu trả lời. Trong cả hai trường hợp, phiên bản miễn phí, công khai đều được sử dụng để tạo ra kết quả.

Câu hỏi số 1: Tiền điện tử là gì?

Câu hỏi đầu tiên chúng tôi hỏi hai hệ thống chỉ đơn giản là “Tiền điện tử là gì?”

Cả hai đều đưa ra những định nghĩa cơ bản tương tự nhau khi các câu trả lời mô tả tiền điện tử là tiền kỹ thuật số thường hoạt động theo bản chất phi tập trung và được phân phối thông qua chuỗi khối. Ngoài ra, cả hai đều liệt kê các tính năng chính của tiền điện tử và đưa ra một số ví dụ, bao gồm Bitcoin ( BTC ), Ether ( ETH ), Litecoin ( LTC ) và Cardano ( ADA ).

Tuy nhiên, điểm khác biệt của chúng nằm ở thông tin bổ sung được cung cấp sau đó. Gemini/Bard đưa ra lời khuyên về việc đầu tư vào tiền điện tử và liên kết đến một nguồn.

Mặt khác, ChatGPT đã kết thúc bằng một lịch sử nhỏ về việc tạo ra Bitcoin bởi Satoshi Nakamoto và sự xuất hiện sau đó của các altcoin.

Câu hỏi số 2: Bitcoin có phải là một khoản đầu tư tốt không?

Chúng tôi cũng đã yêu cầu cả hai mô hình cung cấp cho chúng tôi một số lời khuyên đầu tư, chọn Bitcoin ( BTC ) đã được thử nghiệm và thử nghiệm trong ngành làm tiền điện tử mà chúng tôi lựa chọn. Chúng tôi đã hỏi: “Bitcoin có phải là một khoản đầu tư tốt không?”

Gemini/Bard bắt đầu bằng cách nói rằng câu hỏi này rất phức tạp, trong khi ChatGPT trả lời bằng tuyên bố từ chối trách nhiệm, nói rằng họ “không có khả năng cung cấp lời khuyên tài chính theo thời gian thực”.

Gemini/Bard của Google trả lời câu hỏi đầu tư Bitcoin. Nguồn: Cointelegraph
ChatGPT của OpenAI trả lời câu hỏi đầu tư Bitcoin. Nguồn: Cointelegraph

Cả hai hệ thống đều cung cấp câu trả lời chi tiết cho các câu hỏi, trong đó ChatGPT cung cấp các yếu tố rõ ràng hơn để xem xét trong quá trình đầu tư. Cả hai cũng kết luận với khuyến nghị tìm kiếm một cố vấn tài chính chuyên nghiệp để có thêm “lời khuyên cá nhân hóa”.

Câu hỏi số 3: Satoshi Nakamoto là ai?

Đối với câu hỏi cuối cùng, chúng tôi đã hỏi cả hai mô hình AI một trong những câu đố bí ẩn nhất của ngành công nghiệp tiền điện tử: “Satoshi Nakamoto là ai?”

Trong trường hợp này, cả hai mô hình đều đưa ra câu trả lời chi tiết, mỗi mô hình bao gồm bốn đến sáu khối thông tin toàn văn bản. Gemini/Bard và ChatGPT bắt đầu câu trả lời của họ bằng một đoạn trích về việc Satoshi là “một người hoặc nhóm người ẩn danh đã tạo ra Bitcoin”.

ChatGPT mơ hồ hơn khi mô tả bí ẩn xung quanh danh tính của Satoshi, nói rằng đã có nhiều thuyết âm mưu và tuyên bố về danh tính của anh ta. Tuy nhiên, nó không đề cập đến bất kỳ chi tiết cụ thể nào.

Mặt khác, Gemini/Bard đưa ra ba ví dụ chi tiết về những cá nhân đã cố gắng xác nhận danh tính của Nakamoto.

Gemini/Bard của Google đưa ra ví dụ về tuyên bố của Nakamoto. Nguồn: Cointelegraph

Cả hai mô hình đều nhấn mạnh “bí ẩn” của câu chuyện Satoshi, ChatGPT tuyên bố đây là “một trong những bí ẩn quan trọng nhất chưa được giải đáp trong thế giới tiền điện tử”.

Tổng hợp và chỉnh sửa: ThS Phạm Mạnh Cường
Theo CoinTelegraph

Microsoft phải đối mặt với cuộc điều tra chống độc quyền của Vương quốc Anh về cấu trúc thỏa thuận OpenAI

Cuộc kiểm tra của cơ quan quản lý sẽ đánh giá xem liệu sự hợp tác có cấu thành nên “việc mua lại quyền kiểm soát” hay không, ngụ ý ảnh hưởng đáng kể của một bên đối với bên kia.

Cơ quan quản lý chống độc quyền của Vương quốc Anh đang xem xét bắt đầu một cuộc điều tra sáp nhập vào mối quan hệ hợp tác trị giá hàng tỷ đô la của Microsoft với OpenAI.

Thông báo này đã dẫn đến phản hồi từ Microsoft, tuyên bố rằng họ chỉ đóng vai trò quan sát viên không bỏ phiếu trong hội đồng quản trị của nhà sản xuất ChatGPT.

Thông báo điều tra theo sau tiết lộ của nhà sản xuất ChatGPT rằng gã khổng lồ công nghệ Mỹ sẽ giữ một ghế trong hội đồng không bỏ phiếu. Cuộc kiểm tra sẽ đánh giá liệu sự hợp tác có cấu thành nên “việc mua lại quyền kiểm soát hay không”, ngụ ý ảnh hưởng đáng kể của một bên đối với bên kia, như Cơ quan Cạnh tranh và Thị trường (CMA) đã nêu vào thứ Sáu, ngày 8 tháng 12.

Vị trí quan sát viên có nghĩa là đại diện của Microsoft có thể tham dự các cuộc họp hội đồng quản trị của OpenAI và truy cập thông tin bí mật, nhưng họ không có quyền biểu quyết về các vấn đề bao gồm bầu hoặc chọn giám đốc.

“Trước những phát triển này, CMA hiện đang ban hành ITC để xác định xem liệu mối quan hệ đối tác Microsoft / OpenAI, bao gồm cả những phát triển gần đây, có dẫn đến tình huống sáp nhập có liên quan hay không và nếu có thì tác động tiềm tàng đến cạnh tranh hay không.”

Động thái này được đưa ra sau thông báo vào tháng 11 rằng Microsoft sẽ đảm nhận vị trí không có quyền biểu quyết trong hội đồng quản trị của OpenAI . Đây là lần thứ hai cơ quan quản lý xem xét hoạt động của công ty phần mềm Mỹ trong năm nay và họ cũng cho biết họ đang xem xét liệu thỏa thuận này có dẫn đến tình huống sáp nhập có liên quan hay không.

Phó Chủ tịch kiêm Chủ tịch của Microsoft, Brad Smith, đã nhấn mạnh trên nền tảng X (trước đây gọi là Twitter) rằng thay đổi duy nhất trong sự hợp tác giữa hai công ty là việc Microsoft có một quan sát viên không có quyền bỏ phiếu trong Hội đồng quản trị của OpenAI — khác biệt với các thương vụ mua lại như mua lại Google. DeepMind ở Anh. Smith tuyên bố rằng Microsoft sẵn sàng hợp tác chặt chẽ với CMA.

Theo báo cáo của Bloomberg, Microsoft đã cam kết đầu tư hơn 10 tỷ USD vào OpenAI vào tháng 1 năm 2023. Microsoft cũng chuẩn bị triển khai khoản đầu tư 3,2 tỷ USD vào cơ sở hạ tầng và đào tạo trí tuệ nhân tạo (AI) tại Vương quốc Anh.

Tổng hợp và chỉnh sửa: ThS Phạm Mạnh Cường
Theo CoinTelegraph

Các nhà khoa học Harvard tuyên bố có bước đột phá, 'sự ra đời của tính toán lượng tử sửa lỗi sớm'

Kết quả của nhóm, sau khi được xem xét, có thể là một cột mốc quan trọng trong nghiên cứu điện toán lượng tử.

Khi những người trong ngành nói về một tương lai nơi máy tính lượng tử có khả năng giải quyết các vấn đề mà máy tính nhị phân cổ điển không thể làm được, họ đang đề cập đến một thứ gọi là “lợi thế lượng tử”.

Để đạt được lợi thế này, máy tính lượng tử cần phải đủ ổn định để mở rộng quy mô và khả năng. Nhìn chung, các chuyên gia điện toán lượng tử tin rằng trở ngại lớn nhất đối với khả năng mở rộng trong hệ thống điện toán lượng tử là tiếng ồn.

Bài nghiên cứu của nhóm Harvard, có tiêu đề “Bộ xử lý lượng tử logic dựa trên các mảng nguyên tử có thể cấu hình lại”, mô tả một phương pháp mà các quy trình điện toán lượng tử có thể được chạy với khả năng chống lỗi và khả năng khắc phục nhiễu.

Theo tờ báo:

“Những kết quả này báo trước sự ra đời của tính toán lượng tử sửa lỗi sớm và vạch ra con đường hướng tới các bộ xử lý logic quy mô lớn.”

qubit ồn ào

Những người trong cuộc gọi tình trạng hiện tại của điện toán lượng tử là kỷ nguyên Lượng tử quy mô trung gian ồn ào (NISQ). Thời đại này được xác định bởi các máy tính lượng tử có ít hơn 1.000 qubit (phiên bản lượng tử của bit máy tính), nói chung là “ồn ào”.

Các qubit ồn ào là một vấn đề vì trong trường hợp này, điều đó có nghĩa là chúng dễ bị lỗi.

Nhóm Harvard tuyên bố đã đạt được “các phép tính lượng tử sửa lỗi sớm” giúp khắc phục nhiễu ở quy mô đầu tiên trên thế giới. Tuy nhiên, đánh giá bằng bài báo của họ, họ vẫn chưa sửa được lỗi hoàn toàn. Ít nhất là không như hầu hết các chuyên gia có thể sẽ xem nó.

Lỗi và phép đo

Điện toán lượng tử rất khó vì không giống như bit máy tính cổ điển, về cơ bản, qubit sẽ mất thông tin khi chúng được đo. Và cách duy nhất để biết liệu một qubit vật lý nhất định có gặp lỗi trong tính toán hay không là đo nó. Quần què

Việc sửa lỗi hoàn toàn sẽ đòi hỏi phải phát triển một hệ thống lượng tử có khả năng xác định và sửa lỗi khi chúng xuất hiện trong quá trình tính toán. Cho đến nay, những kỹ thuật này đã được chứng minh là rất khó để mở rộng quy mô.

Những gì bộ xử lý của nhóm Harvard thực hiện, thay vì sửa lỗi trong quá trình tính toán, là thêm giai đoạn phát hiện lỗi sau xử lý trong đó các kết quả sai được xác định và loại bỏ.

Theo nghiên cứu, điều này cung cấp một con đường hoàn toàn mới và có lẽ được tăng tốc để mở rộng quy mô máy tính lượng tử vượt ra ngoài kỷ nguyên NISQ và tiến vào lĩnh vực lợi thế lượng tử.

Mặc dù công việc này đầy hứa hẹn, nhưng thông cáo báo chí của DARPA chỉ ra rằng sẽ cần ít nhất một cấp độ lớn hơn 48 qubit logic được sử dụng trong các thí nghiệm của nhóm để “giải quyết mọi vấn đề lớn được hình dung cho máy tính lượng tử”.

Các nhà nghiên cứu khẳng định các kỹ thuật họ phát triển sẽ có khả năng mở rộng thành các hệ thống lượng tử với hơn 10.000 qubit.

Tổng hợp và chỉnh sửa: ThS Phạm Mạnh Cường
Theo Coindesk

Meta phát hành bộ bảo mật AI 'Purple Llama' để đáp ứng các cam kết của Nhà Trắng

Meta tin rằng đây là “bộ đánh giá an toàn an ninh mạng đầu tiên trong toàn ngành dành cho Mô hình ngôn ngữ lớn (LLM)”.

Meta đã phát hành một bộ công cụ để bảo mật và đánh giá các mô hình trí tuệ nhân tạo tổng hợp (AI) vào ngày 7 tháng 12.

Được mệnh danh là “Purple Llama”, bộ công cụ này được thiết kế để giúp các nhà phát triển xây dựng một cách an toàn và bảo mật bằng các công cụ AI tổng hợp, chẳng hạn như mô hình nguồn mở của Meta, Llama-2.

Đội AI màu tím

Theo một bài đăng trên blog từ Meta, phần “Tím” của “Purple Llama” đề cập đến sự kết hợp giữa “đội đỏ” và “đội xanh”.

Nhóm đỏ là một mô hình trong đó các nhà phát triển hoặc người thử nghiệm nội bộ có mục đích tấn công một mô hình AI để xem liệu chúng có thể tạo ra lỗi, sai sót hoặc các kết quả đầu ra và tương tác không mong muốn hay không. Điều này cho phép các nhà phát triển tạo ra các chiến lược phục hồi chống lại các cuộc tấn công độc hại và bảo vệ khỏi các lỗi về bảo mật và an toàn.

Mặt khác, đội xanh lại hoàn toàn trái ngược. Tại đây, các nhà phát triển hoặc người thử nghiệm phản ứng với các cuộc tấn công của nhóm đỏ để xác định các chiến lược giảm thiểu cần thiết nhằm chống lại các mối đe dọa thực tế trong các mô hình sản xuất, người tiêu dùng hoặc khách hàng.

Mỗi mục tiêu:

“Chúng tôi tin rằng để thực sự giảm thiểu những thách thức mà AI tổng hợp mang lại, chúng tôi cần thực hiện cả tư thế tấn công (đội đỏ) và phòng thủ (đội xanh). Nhóm màu tím, bao gồm cả trách nhiệm của nhóm đỏ và xanh, là một cách tiếp cận hợp tác để đánh giá và giảm thiểu rủi ro tiềm ẩn.”

Bảo vệ mô hình

Bản phát hành mà Meta tuyên bố là “bộ đánh giá an toàn an ninh mạng đầu tiên trong toàn ngành dành cho Mô hình ngôn ngữ lớn (LLM),” bao gồm:

  • Các số liệu để định lượng rủi ro an ninh mạng LLM
  • Công cụ đánh giá tần suất đề xuất mã không an toàn
  • Các công cụ đánh giá LLM để khiến việc tạo mã độc trở nên khó khăn hơn hoặc hỗ trợ thực hiện các cuộc tấn công mạng

Ý tưởng lớn là tích hợp hệ thống vào các đường dẫn mô hình để giảm các kết quả đầu ra không mong muốn và mã không an toàn, đồng thời hạn chế tính hữu ích của việc khai thác mô hình đối với tội phạm mạng và các tác nhân xấu.

Nhóm Meta AI viết: “Với bản phát hành đầu tiên này, chúng tôi mong muốn cung cấp các công cụ giúp giải quyết các rủi ro được nêu trong các cam kết của Nhà Trắng.”

Tổng hợp và chỉnh sửa: ThS Phạm Mạnh Cường
Theo Coindesk

Gemini AI của Google có thực sự thông minh hơn GPT-4 của OpenAI không?

Sau khi Google tung ra mô hình AI hiệu suất cao mới Gemini và tuyên bố nó vượt trội hơn nhiều so với GPT-4 của OpenAI, người dùng trên mạng xã hội bắt đầu phản đối những tuyên bố đó.

Google đã ra mắt mô hình trí tuệ nhân tạo (AI) Gemini mới nhất của mình vào ngày 6 tháng 12, công bố đây là mô hình AI tiên tiến nhất hiện có trên thị trường, vượt qua GPT-4 của OpenAI.

Gemini là đa phương thức, có nghĩa là nó được xây dựng để hiểu và kết hợp các loại thông tin khác nhau. Nó có ba phiên bản (Ultra, Pro, Nano) để phục vụ các trường hợp sử dụng khác nhau và một lĩnh vực mà nó có vẻ đánh bại GPT-4 là khả năng thực hiện toán học nâng cao và mã hóa chuyên biệt.

Khi ra mắt, Google đã phát hành nhiều bài kiểm tra điểm chuẩn so sánh Gemini với GPT-4. Phiên bản Gemini Ultra đã đạt được “hiệu suất tiên tiến” ở 30 trên 32 điểm chuẩn học thuật được sử dụng trong quá trình phát triển mô hình ngôn ngữ lớn (LLM).

So sánh hiệu suất của Gemini và ChatGPT. Nguồn: Google

Tuy nhiên, đây chính là lúc các nhà phê bình trên internet chọc tức Gemini và đặt câu hỏi về các phương pháp được sử dụng trong bài kiểm tra điểm chuẩn cho thấy sự vượt trội của Gemini, cùng với hoạt động tiếp thị sản phẩm của Google.

Xúc tiến Gemini “gây hiểu lầm”

Một người dùng trên nền tảng truyền thông xã hội X làm việc trong lĩnh vực phát triển máy học đã đặt câu hỏi liệu tuyên bố của Gemini về tính ưu việt so với GPT-4 có đúng hay không.

Ông chỉ ra rằng Google có thể đang thổi phồng sự vượt trội của Gemini hoặc những ví dụ “hái anh đào” về tính ưu việt của nó. Tuy nhiên, anh ấy kết luận, “tôi cá là Gemini rất cạnh tranh và sẽ giúp GPT-4 kiếm được tiền” và sự cạnh tranh trong không gian này là tốt.

Tuy nhiên, ngay sau đó, anh ấy đã đăng bài thứ hai nói rằng Google nên “xấu hổ” vì quảng cáo sản phẩm “gây hiểu lầm” trong một video quảng cáo mà họ tạo ra để phát hành Gemini.

Đáp lại dòng tweet của anh ấy, những người dùng X khác đã lên tiếng về việc cảm thấy bị lừa dối bởi hình ảnh Song Tử của Google. Một người dùng cho biết những tuyên bố rằng Gemini sẽ kết thúc kỷ nguyên GPT-4 đã bị “hủy bỏ”.

Một người dùng khác, một nhà khoa học máy tính, cũng đồng ý và gọi việc Google mô tả sự vượt trội của Gemini là “không thành thật”.

Điểm chuẩn hỏng

Người dùng chỉ ra rằng Google đã đưa vào các điểm chuẩn sử dụng phiên bản GPT-4 đã lỗi thời thay vì dung lượng hiện tại của nó và do đó những so sánh là dư thừa.

Một lĩnh vực khác mà các nhà thám hiểm mạng xã hội quan tâm là các thông số mà Google sử dụng để so sánh mô hình Gemini của họ với GPT-4. Hơn nữa, lời nhắc đưa ra cho cả hai mô hình không giống nhau, điều này có thể có tác động lớn đến kết quả.

Người dùng cũng chỉ ra rằng kết quả đạt được bằng cách sử dụng các thử nghiệm được thực hiện trên một mô hình “hiện chưa được công bố rộng rãi”. Một người dùng khác chỉ ra rằng điểm số có thể khác nếu mẫu cao cấp của Gemini được thử nghiệm với phiên bản cao cấp của GPT-4 được gọi là “turbo”.

Để kiểm tra

Những người dùng mạng xã hội khác đã quyết định loại bỏ các điểm chuẩn do Google công bố và thay vào đó họ mô tả trải nghiệm của chính họ với Gemini so với GPT-4.

Anne Moss, người làm việc trong các dịch vụ xuất bản web và tự nhận là người dùng thường xuyên của AI, đặc biệt là GPT-4, cho biết cô đã sử dụng Gemini thông qua công cụ Bard của Google và cảm thấy “không hài lòng với trải nghiệm này”.

Cô kết luận rằng hiện tại cô sẽ bám sát GPT-4 để giải thích rằng những điểm khác biệt mà cô lưu ý bao gồm việc Gemini/Bard từ chối trả lời các câu hỏi chính trị và “nói dối” về việc biết thông tin cá nhân.

Một người dùng khác làm việc trong lĩnh vực phát triển ứng dụng đã đăng ảnh chụp màn hình, trong đó anh ta yêu cầu cả hai mô hình, thông qua cùng một lời nhắc, tạo mã dựa trên một bức ảnh. Anh ấy chỉ ra phản ứng kém cỏi của Gemini/Bard so với GPT-4.

Theo Google, họ có kế hoạch tung ra Gemini rộng rãi hơn cho công chúng vào đầu năm 2024. Mô hình này cũng sẽ được tích hợp với bộ ứng dụng và dịch vụ của Google.

Tổng hợp và chỉnh sửa: ThS Phạm Mạnh Cường
Theo Coindesk

Các quy định về AI được chú trọng toàn cầu khi EU tiếp cận thỏa thuận quy định

Những lo ngại về khả năng lạm dụng AI đã khiến Mỹ, Anh, Trung Quốc và G7 tăng tốc quản lý công nghệ, nhưng châu Âu đã đi trước.

Sự gia tăng phát triển trí tuệ nhân tạo (AI) đã thúc đẩy các chính phủ trên toàn cầu gấp rút điều chỉnh công nghệ mới nổi. Xu hướng này phù hợp với những nỗ lực của Liên minh Châu Âu trong việc thực hiện bộ quy tắc toàn diện đầu tiên trên thế giới về AI.

Đạo luật AI của EU được công nhận là một bộ quy định mang tính đổi mới . Sau nhiều lần trì hoãn, các báo cáo chỉ ra rằng vào ngày 7 tháng 12, các nhà đàm phán đã đồng ý về một bộ biện pháp kiểm soát đối với các công cụ AI tổng hợp như ChatGPT của OpenAI và Bard của Google.

Những lo ngại về khả năng lạm dụng công nghệ này cũng đã thúc đẩy Hoa Kỳ, Vương quốc Anh, Trung Quốc và các nước G7 khác đẩy nhanh công việc quản lý AI.

Vào tháng 6, chính phủ Úc đã công bố một cuộc tham vấn kéo dài 8 tuần để nhận phản hồi về việc có nên cấm các công cụ AI “có nguy cơ cao” hay không. Cuộc tham vấn được kéo dài đến ngày 26 tháng 7. Chính phủ đã thu thập ý kiến đóng góp về các chiến lược nhằm chứng thực “việc sử dụng AI một cách an toàn và có trách nhiệm”, khám phá các lựa chọn như các biện pháp tự nguyện như khuôn khổ đạo đức, sự cần thiết của các quy định cụ thể hoặc sự kết hợp của cả hai phương pháp tiếp cận.

Trong khi đó, trong các biện pháp tạm thời bắt đầu từ ngày 15 tháng 8, Trung Quốc đã đưa ra các quy định để giám sát ngành công nghiệp AI tổng quát, yêu cầu các nhà cung cấp dịch vụ phải trải qua các đánh giá bảo mật và được cấp phép trước khi giới thiệu các sản phẩm AI ra thị trường đại chúng. Sau khi nhận được sự chấp thuận của chính phủ, bốn công ty công nghệ Trung Quốc, bao gồm Baidu và SenseTime, đã công bố chatbot AI của họ ra công chúng vào ngày 31 tháng 8.

Theo báo cáo của Politico, cơ quan giám sát quyền riêng tư của Pháp, Ủy ban Nationale Informatique & Libertés, hay CNIL, cho biết vào tháng 4 rằng họ đang điều tra một số khiếu nại về ChatGPT sau khi chatbot tạm thời bị cấm ở Ý do nghi ngờ vi phạm các quy tắc quyền riêng tư, bỏ qua các cảnh báo từ cơ quan dân sự. các nhóm quyền.

Cơ quan bảo vệ dữ liệu Ý, cơ quan quản lý quyền riêng tư địa phương, đã công bố khởi động một cuộc điều tra “tìm hiểu thực tế” vào ngày 22 tháng 11, trong đó cơ quan này sẽ xem xét hoạt động thu thập dữ liệu để đào tạo các thuật toán AI. Cuộc điều tra nhằm xác nhận việc thực hiện các biện pháp bảo mật phù hợp trên các trang web công cộng và tư nhân nhằm cản trở việc “quét web” dữ liệu cá nhân được các bên thứ ba sử dụng để đào tạo AI.

Hoa Kỳ, Vương quốc Anh, Úc và 15 quốc gia khác gần đây đã ban hành các hướng dẫn toàn cầu nhằm giúp bảo vệ các mô hình trí tuệ nhân tạo (AI) khỏi bị giả mạo, đồng thời kêu gọi các công ty làm cho mô hình của họ “an toàn theo thiết kế”.

Tổng hợp và chỉnh sửa: ThS Phạm Mạnh Cường
Theo Coindesk

Exit mobile version