বৃহস্পতিবার, ২৩ এপ্রিল ২০২৬, ০৮:৫২ অপরাহ্ন
নিয়োগ বিজ্ঞপ্তি ::
সিটিজেন নিউজ টুয়েন্টিফোর ডটকমের জন্য প্রতিনিধি নিয়োগ চলছে। যারা আগ্রহী আমাদের ই-মেইলে সিভি পাঠান

নতুন ‘ইমেজেস ২.০’ মডেলে লেখা তৈরিতেও এগিয়েছে চ্যাটজিপিটি

  • আপডেট টাইম : বৃহস্পতিবার, ২৩ এপ্রিল, ২০২৬
  • ১ বার পঠিত

তথ্যপ্রযুক্তি ডেস্ক: অপেনএআই নতুন ‘ইমেজেস ২.০’ মডেলে ছবি তৈরির ক্ষেত্রে উল্লেখযোগ্য অগ্রগতি সাধন করেছে। এই মডেলটি এখন এমন ছবি তৈরি করতে সক্ষম, যেখানে লেখা প্রায় নিখুঁতভাবে উপস্থাপন করা যায়। পূর্বে, ছবির লেখার সঠিকতা ছিল এআইয়ের জন্য একটি বড় চ্যালেঞ্জ।

প্রযুক্তিবিষয়ক সাইট টেকক্রাঞ্চের এক প্রতিবেদনে বলা হয়েছে, চ্যাটজিপিটির ‘ইমেজেস ২.০’ মডেল এখন এমন মানের লেখা তৈরি করতে পারে। যা সরাসরি ব্যবহারযোগ্য। উদাহরণ হিসেবে একটি রেস্টুরেন্টের মেনু তৈরি করে দেখা গেছে সেটি বাস্তব মেনুর মতোই স্বাভাবিক দেখাচ্ছে।

এর আগে ছবি তৈরির এআই মডেলগুলো মূলত ‘ডিফিউশন মডেল’ ব্যবহার করত। এই পদ্ধতিতে এলোমেলো পিক্সেল থেকে ধীরে ধীরে ছবি তৈরি করা হয়। ফলে ছবির মূল অবজেক্ট ভালোভাবে তৈরি হলেও ছোট অংশ প্রায়ই ভুল হতো।

বিশেষজ্ঞদের ভাষায়, লেখার অংশটি ছবির খুব ছোট একটি অংশ হওয়ায় মডেল সেটিকে ঠিকভাবে শেখাতে পারত না। তাই অদ্ভুত বানান বা বিকৃত শব্দ দেখা যেত।

তবে নতুন মডেলে এই সীমাবদ্ধতা কমেছে। গবেষকেরা ‘অটোরিগ্রেসিভ’ মডেলের মতো নতুন পদ্ধতি ব্যবহার করছেন। যা ভাষা মডেলের মতো কাজ করে। এতে ছবি তৈরির সময় লেখা বা সূক্ষ্ম উপাদানগুলোও বেশি নির্ভুলভাবে তৈরি করা সম্ভব হচ্ছে। যদিও নতুন মডেলের পেছনে ঠিক কোন প্রযুক্তি ব্যবহার করা হয়েছে সে বিষয়ে বিস্তারিত জানায়নি অপেনএআই।

প্রতিষ্ঠানটি জানিয়েছে, ‘ইমেজেস ২.০’ মডেলে “থিংকিং ক্যাপাবিলিটি” বা চিন্তাভাবনার সক্ষমতা যুক্ত করা হয়েছে। এর ফলে এটি একটি প্রম্পট থেকে একাধিক ছবি তৈরি করতে পারে। প্রয়োজনে তথ্য যাচাই করতে পারে এবং জটিল ডিজাইনও তৈরি করতে সক্ষম।

এই মডেল দিয়ে বিভিন্ন আকারের মার্কেটিং ভিজ্যুয়াল, কমিক স্ট্রিপ বা ইউআই ডিজাইন তৈরি করা সম্ভব। এমনকি জাপানি, কোরিয়ান, হিন্দি ও বাংলার মতো নন-ল্যাটিন ভাষার লেখাও তুলনামূলকভাবে ভালোভাবে তৈরি করতে পারে।

তবে এই উন্নতির একটি সীমাবদ্ধতাও রয়েছে। মডেলটির জ্ঞানভান্ডার ২০২৫ সালের ডিসেম্বর পর্যন্ত। ফলে সাম্প্রতিক কোনো তথ্য বা ঘটনার ক্ষেত্রে এটি সব সময় নির্ভুল নাও হতে পারে।

অপেনএআই বলছে, নতুন মডেলটি আগের তুলনায় আরও নির্দিষ্ট নির্দেশনা বুঝতে পারে এবং সূক্ষ্ম বিষয়গুলো ভালোভাবে ফুটিয়ে তুলতে সক্ষম। ছোট লেখা, আইকন, জটিল কম্পোজিশন এসব ক্ষেত্রেও উন্নতি দেখা যাচ্ছে। সর্বোচ্চ টু-কে রেজোলিউশনের ছবি তৈরি করা সম্ভব।

তবে এই মানের ছবি তৈরি করতে কিছুটা বেশি সময় লাগে। সাধারণ প্রশ্নের উত্তর দেওয়ার মতো দ্রুত না হলেও জটিল ছবি তৈরিতে কয়েক মিনিট সময় লাগতে পারে।

প্রতিষ্ঠানটি জানিয়েছে, চ্যাটজিপিটি ও কোডেক্স ব্যবহারকারীরা ধাপে ধাপে এই ফিচার ব্যবহার করতে পারবেন। পেইড ব্যবহারকারীরা উন্নত মানের আউটপুট তৈরি করার সুযোগ পাবেন। পাশাপাশি ‘জিপিটি-ইমেজ-২’ নামে একটি এপিআইও উন্মুক্ত করা হবে। যার খরচ নির্ভর করবে ছবির মান ও রেজুলেশনের ওপর।

বিশ্লেষকদের মতে, এই উন্নয়ন ডিজিটাল কনটেন্ট তৈরির ক্ষেত্রে বড় পরিবর্তন আনতে পারে। ডিজাইনার, বিপণনকর্মী ও সাধারণ ব্যবহারকারীদের জন্য দ্রুত এবং কম খরচে মানসম্মত ভিজ্যুয়াল তৈরি করা আরও সহজ হবে। একই সঙ্গে এআই-তৈরি কনটেন্ট ও বাস্তব কনটেন্ট আলাদা করা আরও কঠিন হয়ে উঠতে পারে।

নিউজটি শেয়ার করুন

এ জাতীয় আরো খবর..
© All rights reserved  2019 CitizenNews24
Theme Developed BY ThemesBazar.Com