Khám phá Midjourney là gì và tìm hiểu những điều cần thiết khi sử dụng công cụ AI cải tiến này để tạo ra những tác phẩm nghệ thuật tuyệt đẹp và độc đáo.
Midjourney là một nền tảng hỗ trợ trí tuệ nhân tạo (AI) tổng hợp cho phép người dùng tạo ra các tác phẩm nghệ thuật độc đáo như nhân vật, hình ảnh và mô tả thông qua các lời nhắc bằng văn bản ngắn.
Nền tảng AI tổng quát là một hệ thống trí tuệ nhân tạo có thể tạo ra nội dung mới và độc đáo, thường ở dạng hình ảnh, văn bản hoặc các sản phẩm sáng tạo khác. Không giống như các hệ thống AI dựa trên quy tắc truyền thống được thiết kế cho các nhiệm vụ cụ thể, nền tảng AI tổng quát sử dụng các thuật toán nâng cao, thường dựa trên các kỹ thuật học sâu , để tự động tạo ra các kết quả đầu ra mới và phù hợp với ngữ cảnh.
Midjourney AI là một trong những nền tảng AI mang tính sáng tạo, mở ra những khả năng mới để thể hiện sáng tạo và có thể tạo ra kết quả vượt xa những gì đã được lập trình rõ ràng, đưa yếu tố khó đoán và sáng tạo vào bối cảnh AI. Điều này có thể được áp dụng cho nhiều lĩnh vực nghệ thuật khác nhau để tạo ra những hình ảnh chân thực không tồn tại trong thế giới thực.
Bài viết này thảo luận về Midjourney AI là gì, Midjourney hoạt động như thế nào, lời nhắc hiệu quả, Midjourney khác với Dall-E 2 như thế nào và lợi ích của tác phẩm nghệ thuật Midjourney. Nó cũng sẽ đặt ra câu hỏi còn sót lại: Việc sử dụng nghệ thuật do AI tạo ra có hợp đạo đức không? Ngoài ra còn có hướng dẫn từng bước về cách sử dụng Midjourney dành cho các nghệ sĩ để tạo ra các tác phẩm nghệ thuật độc đáo do AI tạo ra.
AI giữa hành trình là gì?
Midjourney là một chương trình và dịch vụ AI tổng hợp của phòng thí nghiệm nghiên cứu Midjourney, Inc. Nhóm Midjourney do David Holz, người đồng sáng lập của Leap Motion, lãnh đạo. Giống như DALL-E của OpenAI và Stable Diffusion của AI ổn định, Midjourney tạo ra hình ảnh bằng cách sử dụng mô tả ngôn ngữ tự nhiên được gọi là lời nhắc.
Trang web của Midjourney tự mô tả mình là “một phòng thí nghiệm nghiên cứu độc lập khám phá những phương tiện tư duy mới và mở rộng sức mạnh tưởng tượng của loài người”.
Nó đã ở giai đoạn thử nghiệm mở kể từ ngày 12 tháng 7 năm 2022 và người dùng có thể tạo tác phẩm nghệ thuật chất lượng cao với Midjourney bằng cách sử dụng lời nhắc dựa trên văn bản đơn giản trong lệnh bot Discord. Không cần phần cứng hoặc phần mềm chuyên dụng để sử dụng Midjourney. Tuy nhiên, để truy cập dịch vụ, cần phải có tài khoản Discord.
Midjourney hoạt động như thế nào?
Midjourney hoạt động thông qua sự tương tác tinh vi của hai công nghệ máy học: mô hình ngôn ngữ lớn và mô hình phổ biến. Khi người dùng nhập lời nhắc, một mô hình ngôn ngữ lớn sẽ giải mã nghĩa của các từ và biến nó thành một vectơ số.
Vectơ này đóng vai trò then chốt trong việc hướng dẫn quá trình khuếch tán, trong đó Midjourney sử dụng mô hình khuếch tán để biến tiếng ồn ngẫu nhiên thành tác phẩm nghệ thuật hấp dẫn về mặt thị giác. Các mô hình khuếch tán liên quan đến việc thêm dần nhiễu ngẫu nhiên vào tập dữ liệu hình ảnh huấn luyện . Mô hình này trở nên thành thạo trong việc tạo ra các hình ảnh hoàn toàn mới bằng cách học cách đảo ngược nhiễu này theo thời gian.
Ví dụ: nếu người dùng nhập lời nhắc văn bản chẳng hạn như “ Khai thác Bitcoin với màu sắc tươi sáng và giao diện hoạt hình”, Midjourney sẽ bắt đầu bằng một trường nhiễu hình ảnh. Thông qua sự khuếch tán tiềm ẩn, một mô hình AI được đào tạo sẽ loại bỏ nhiễu một cách có hệ thống, dần dần tiết lộ hình ảnh thể hiện bản chất của các đối tượng và chủ đề được chỉ định trong lời nhắc ban đầu.
Sức mạnh tổng hợp của mô hình khuếch tán và hiểu ngôn ngữ cho phép Midjourney tạo ra các tác phẩm nghệ thuật đa dạng và hấp dẫn do AI tạo ra dựa trên đầu vào hoặc lời nhắc của người dùng.
Cách bắt đầu với Midjourney – Hướng dẫn từng bước
Bản beta giữa hành trình chỉ có thể được truy cập thông qua tài khoản Discord. Dưới đây là hướng dẫn từng bước về cách sử dụng Midjourney để tạo các hình ảnh độc đáo do AI tạo ra:
Bước 1: Tham gia Midjourney Discord
Người dùng Discord hiện tại có thể truy cập Midjourney.com, nhấp vào nút “Tham gia bản Beta” hoặc truy cập trực tiếp vào Midjourney Discord . Đối với những người chưa có tài khoản Discord, hãy đăng ký tạo tài khoản miễn phí trên Discord trước rồi tham gia máy chủ Midjourney Discord. Bạn có thể truy cập Midjourney Discord từ mọi nơi – ứng dụng web, thiết bị di động và máy tính để bàn.
Bước 2: Chọn gói thuê bao
Khi dịch vụ này ra mắt lần đầu tiên vào tháng 7 năm 2022, bất kỳ ai cũng có thể sử dụng nó để tạo 25 hình ảnh miễn phí. Tuy nhiên, điều này đã thay đổi vào tháng 4 năm 2023 khi Midjourney tạm dừng chương trình dùng thử miễn phí. Midjourney không còn được cung cấp miễn phí ngoại trừ một số thời gian khuyến mại ngắn hạn. Kế hoạch giá có thể được tìm thấy trong bảng dưới đây.
Bước 3: Sử dụng lệnh “/imagine” để tạo tác phẩm nghệ thuật
Để bắt đầu, bạn có thể truy cập kênh “#newbies”, theo sau là một số trên máy chủ Midjourney Discord. Có rất nhiều kênh như vậy và bạn có thể chọn bất kỳ kênh nào trong số đó. Trong kênh dành cho người mới bắt đầu, hãy nhập “/” theo sau là “tưởng tượng” và lời nhắc để Midjourney tạo các hình ảnh được yêu cầu.
Ví dụ: /imagine gợi ý: “ Khai thác bitcoin có màu sắc tươi sáng với hình thức hoạt hình”.
Một ví dụ khác về lời nhắc /imagine, “ Các yếu tố chuỗi khối Ethereum trong môi trường công nghệ hiện đại,” đã cho kết quả như sau:
Mất bao lâu để Midjourney tạo ra một hình ảnh?
Trung bình, Midjourney mất khoảng một phút để tạo ra bốn tùy chọn tác phẩm nghệ thuật. Tuy nhiên, điều này không cố định và thời gian có thể tăng lên nếu người ta muốn hình ảnh được nâng cấp hoặc đầu ra có tỷ lệ khung hình không vuông.
Gói đăng ký giữa hành trình có các chế độ nhanh và thoải mái, điều này sẽ thay đổi tốc độ tạo theo gói đã đăng ký. Ở chế độ nhanh, việc xếp hàng chờ sau người khác là không cần thiết. Tuy nhiên, ngay cả những gói trả phí đắt nhất cũng có giới hạn hàng tháng về số lượng hình ảnh được tạo ở chế độ nhanh.
Ở chế độ thoải mái, các yêu cầu hình ảnh sẽ được gửi đến hàng đợi. Quá trình tạo có thể mất từ một đến 10 phút để hoàn thành. Ngoài ra, Midjourney còn có chế độ “Turbo” đắt tiền có thể được kích hoạt bằng lệnh “/ turbo”. Chế độ Turbo tạo ra hình ảnh mới nhanh hơn bốn lần nhưng tiêu tốn gấp đôi thời gian so với mức cho phép hàng tháng của gói đăng ký của bạn.
Làm cách nào để lưu hình ảnh Midjourney và ai sở hữu chúng?
Để lưu hình ảnh được tạo trên Midjourney, hãy nhấp vào hình ảnh để mở ở kích thước đầy đủ, sau đó nhấp chuột phải và chọn tùy chọn “Save image”. Trên thiết bị di động, nhấn và giữ vào hình ảnh rồi nhấn vào biểu tượng tải xuống ở góc trên cùng bên phải.
Midjourney cho phép người dùng xem tất cả các hình ảnh đã tạo trước đó, bao gồm cả lời nhắc được sử dụng để tạo chúng. Để truy cập các hình ảnh Midjourney đã tạo trước đó trên Discord, hãy chuyển đến tab “Đề cập” của Hộp thư đến Discord và tải xuống các hình ảnh trước đó.
Hình ảnh giữa hành trình thuộc phạm vi công cộng và quyền sở hữu là nguồn mở. Midjourney tựmô tả mình là một cộng đồng mở cho phép người khác sử dụng và phối lại các hình ảnh cũng như lời nhắc khi được đăng ở chế độ công khai. Theo mặc định, tất cả hình ảnh trên Midjourney đều có thể xem và phối lại công khai. Vì vậy, chúng có thể được truy cập và sửa đổi bởi bất kỳ ai. Điều này khiến việc bán tác phẩm nghệ thuật Midjourney trở nên đáng nghi ngờ.
Sự khác biệt giữa Midjourney và Dall-E 2 là gì?
Dall-E 2 là mô hình chuyển văn bản thành hình ảnh và là phiên bản kế thừa của Dall-E được xây dựng bởi phòng thí nghiệm nghiên cứu OpenAI đã ra mắt ChatGPT. Năm 2019, OpenAI đã nhận được hơn 1 tỷ USD tài trợ từ Microsoft và Khosla Ventures. Vào tháng 1 năm 2023, sau khi ra mắt Dall-E 2 và ChatGPT, OpenAI đã nhận được thêm 10 tỷ USD tài trợ từ Microsoft. Midjourney được tự tài trợ và xây dựng bởi một phòng thí nghiệm độc lập, Midjourney Inc.
Trong khi Dall-E 2 và Midjourney dựa trên mô tả ngôn ngữ tự nhiên tạo ra hình ảnh từ lời nhắc, việc sử dụng tùy thuộc vào yêu cầu và sở thích cụ thể. Một số khác biệt như sau:
- Quyền truy cập: Midjourney có thể được truy cập thông qua Discord, trong khi Dall-E 2 chỉ khả dụng qua trang web của OpenAI.
- Độ phân giải hình ảnh: Midjourney có thể tạo ra hình ảnh có độ phân giải 1792×1024, trong khi Dall-E 2 tạo ra độ phân giải 1024×1024.
- Đăng ký: Cả hai đều có gói đăng ký và người dùng có thể kiểm tra mức giá cập nhật trên các trang web tương ứng để xem gói nào phù hợp nhất với họ.
Lợi ích và tận dụng Midjourney
Midjourney đã cho phép các nghệ sĩ khám phá nhiều phong cách, chủ đề và khái niệm nghệ thuật khác nhau, thúc đẩy sự sáng tạo và vượt qua ranh giới của các loại hình nghệ thuật truyền thống. Các nghệ sĩ có thể thử nghiệm nhiều tham số và kỹ thuật, tạo ra các sản phẩm linh hoạt, từ các tác phẩm trừu tượng đến các hình ảnh thể hiện thực tế. Tiết kiệm thời gian nhờ khả năng quay vòng AI nhanh chóng để tạo hình ảnh.
Hơn nữa, việc tích hợp với các nền tảng như Discord sẽ nâng cao các khía cạnh hợp tác của Midjourney, cho phép các nghệ sĩ chia sẻ ý tưởng, kỹ thuật và sáng tạo trong cộng đồng những cá nhân có cùng chí hướng.
Bên cạnh sự thể hiện nghệ thuật, Midjourney còn có lợi cho việc tạo hình ảnh sản phẩm, hình minh họa, quảng cáo trên mạng xã hội, tài sản tiếp thị,dự án nghệ thuật mã thông báo không thể thay thế (NFT) , hình ảnh kiến trúc, v.v.
Nghệ thuật AI có hợp pháp và đạo đức không?
Mặc dù nghệ thuật AI là hợp pháp nhưng ý nghĩa đạo đức của nó rất đa dạng và liên quan đến những cân nhắc liên quan đến tính sáng tạo, quyền sở hữu, thành kiến và tác động xã hội. Tranh cãi chung là mặc dù các công cụ AI góp phần tạo nên sự sáng tạo nhưng đầu vào và hướng dẫn lại đến từ con người. Hướng dẫn rõ ràng về phân bổ và quyền sở hữu là điều cần thiết để giải quyết những vấn đề này.
Việc sử dụng thương mại các tác phẩm nghệ thuật do AI tạo ra đặt ra câu hỏi về sự đền bù công bằng và khả năng đạo văn. Các nghệ sĩ nên nhận thức được ý nghĩa đạo đức của việc bán tác phẩm do AI tạo ra và cách nó phù hợp với các chuẩn mực đã được thiết lập trong thế giới nghệ thuật.
Các mô hình AI được đào tạo trên các tập dữ liệu có thể mang những thành kiến có trong dữ liệu – thành kiến về giới tính, chủng tộc hoặc văn hóa. Điều này vô tình có thể dẫn đến những kết quả đầu ra sai lệch, củng cố những khuôn mẫu hoặc định kiến hiện có. Các nghệ sĩ và nhà phát triển cần phải nhận thức được những thành kiến này và nỗ lực giảm thiểu chúng.
Các tài nguyên tính toán cần thiết để đào tạo và chạy các mô hình AI tiên tiến như Midjourney và Dall-E 2 gây ra những lo ngại về môi trường. Diễn ngôn về đạo đức nên xem xét lượng khí thải carbon liên quan đến các hoạt động AI quy mô lớn.
Tổng hợp và chỉnh sửa: ThS Phạm Mạnh Cường
Theo CoinTelegraph