কৃত্রিম বুদ্ধিমত্তাভিত্তিক ছবি তৈরির প্রযুক্তিতে আরও এক ধাপ এগোল ওপেনএআই। প্রতিষ্ঠানটি নতুন একটি ইমেজ জেনারেশন মডেল উন্মোচন করেছে। মডেলটির নাম ‘জিপিটি ইমেজ ১.৫’। মঙ্গলবার থেকে এটি চ্যাটজিপিটি ব্যবহারকারীদের জন্য চালু হয়েছে। এপিআইয়ের মাধ্যমেও এটি ব্যবহার করা যাবে।

ওপেনএআই জানায়, নতুন এই মডেল আগের তুলনায় নির্দেশনা ভালোভাবে অনুসরণ করতে পারে। ছবি সম্পাদনা হবে আরও নিখুঁতভাবে। ছবি তৈরির গতি বাড়বে চার গুণ পর্যন্ত।

এআই প্রযুক্তির বাজারে প্রতিযোগিতা দিন দিন তীব্র হচ্ছে। বিশেষ করে গুগলের জেমিনি সিরিজের সঙ্গে ওপেনএআইয়ের লড়াই এখন প্রকাশ্য। গত মাসে ওপেনএআইয়ের প্রধান নির্বাহী স্যাম অল্টম্যান একটি অভ্যন্তরীণ বার্তায় ‘কোড রেড’ ঘোষণা করেন। সেখানে বলা হয়, বাজারে নেতৃত্ব ধরে রাখতে দ্রুত নতুন প্রযুক্তি আনবে ওপেনএআই।

গুগল সম্প্রতি তাদের জেমিনি ৩ এবং নতুন ইমেজ জেনারেটর ‘ন্যানো বানানা প্রো’ উন্মোচন করেছে। এগুলো একাধিক মানদণ্ডে ভালো ফল দেখিয়েছে। এর জবাবে ওপেনএআই গত সপ্তাহে জিপিটি–৫.২ মডেল ছাড়ে। এবার এল নতুন ইমেজ মডেল।

ওপেনএআইয়ের আগের ইমেজ মডেল ‘জিপিটি ইমেজ ১’ প্রকাশিত হয়েছিল এপ্রিলে। নতুন সংস্করণে যুক্ত হয়েছে উন্নত পোস্ট–প্রোডাকশন সুবিধা। ছবি সম্পাদনার সময় মুখের অভিব্যক্তি, আলো, রঙ ও কম্পোজিশনের সামঞ্জস্য রাখা সহজ হবে।

এআই দিয়ে ছবি সম্পাদনায় বড় সমস্যা ছিল ধারাবাহিকতা। একটি ছোট পরিবর্তনের অনুরোধে পুরো ছবি বদলে যেত। ওপেনএআই বলছে, নতুন মডেল এই সমস্যার সমাধান করবে।

চ্যাটজিপিটিতে ছবির জন্য আলাদা একটি ইন্টারফেসও যুক্ত করা হয়েছে। সাইডবারে থাকা এই অংশটি কাজ করবে একটি ‘ক্রিয়েটিভ স্টুডিও’র মতো। এখানে ছবি দেখা, সম্পাদনা এবং নতুন আইডিয়া নেওয়া সহজ হবে।

ওপেনএআইয়ের অ্যাপ্লিকেশন প্রধান নির্বাহী ফিদজি সিমো এক ব্লগ পোস্টে বলেন, ছবি তৈরির অভিজ্ঞতা আরও ভিজ্যুয়াল করা হচ্ছে। ব্যবহারকারীরা এখন ট্রেন্ডিং প্রম্পট ও প্রস্তুত ফিল্টার থেকেও অনুপ্রেরণা পাবেন।

এ ছাড়া সার্চ ফলাফলেও আরও ভিজ্যুয়াল তথ্য দেখানোর পরিকল্পনা রয়েছে। এতে মাপজোক রূপান্তর বা খেলাধুলার স্কোর দেখার মতো কাজে সুবিধা হবে।

ওপেনএআই বলছে, লক্ষ্য একটাই। ব্যবহারকারীর ভাবনাকে দ্রুত বাস্তবে রূপ দেওয়া। শব্দের পাশাপাশি ছবি দিয়েও গল্প বলাই এখন তাদের নতুন অগ্রাধিকার।