ChatGPT ক্রিয়েটরের ছবি তৈরি করার জন্য নতুন এআই টুল পয়েন্ট-ই সম্পর্কে বিস্তারিত জানুন

ChatGPT ক্রিয়েটরের ছবি তৈরি করার জন্য নতুন এআই টুল পয়েন্ট-ই সম্পর্কে বিস্তারিত জানুন

ChatGPT নির্মাতা ওপেনএআই মিনিটের মধ্যে 3D ছবি তৈরি করার জন্য একটি নতুন এআই টুল Point-E প্রকাশ করেছে। Point-E, অন্যান্য 3D ইমেজ জেনারেটর থেকে ভিন্ন, কাজ করার জন্য একটি উচ্চ-সম্পন্ন কম্পিউটারের প্রয়োজন হয় না।

ChatGPT কি?

চ্যাট জেনারেটিভ প্রাক-প্রশিক্ষিত ট্রান্সফরমার হল একটি চ্যাটবট যা OpenAI দ্বারা তৈরি করা হয়েছে। ChatGPT বৃহৎ ভাষা মডেলের OpenAI-এর GPT-3.5-এ নির্মিত, এবং তত্ত্বাবধানে এবং শক্তিবৃদ্ধি শেখার কৌশল উভয়ের সাথেই ভালো। ChatGPT এবং GPT 3.5 Azure AI সুপারকম্পিউটিং পরিকাঠামোর উপর প্রশিক্ষিত হয়েছিল। ChatGPT চ্যাট করতে পারে, প্রশ্নের উত্তর দিতে পারে, বিষয়বস্তু তৈরি করতে পারে, কোড লিখতে এবং ডিবাগ করতে পারে, পরীক্ষা করতে পারে, ডেটা ম্যানিপুলেট করতে পারে, ব্যাখ্যা করতে এবং টিউটর করতে পারে এবং আরও অনেক কিছু করতে পারে!

ChatGPT কিসের জন্য ব্যবহার করা হয়?

ChatGPT শুধুমাত্র ইন্টারনেট লিঙ্কের তালিকার পরিবর্তে পরিষ্কার, সহজ বাক্যে তথ্য প্রদান করতে পারে। এটি ধারণাগুলিকে এমনভাবে ব্যাখ্যা করতে পারে যা লোকেরা সহজেই বুঝতে পারে। এমনকি এটি ব্যবসার কৌশল, ক্রিসমাস উপহারের পরামর্শ, ব্লগের বিষয় এবং ছুটির পরিকল্পনা সহ স্ক্র্যাচ থেকে ধারণা তৈরি করতে পারে।

ChatGPT নির্মাতা ওপেনএআই মিনিটের মধ্যে 3D ছবি তৈরি করার জন্য একটি নতুন এআই টুল Point-E প্রকাশ করেছে। Point-E, অন্যান্য 3D ইমেজ জেনারেটর থেকে ভিন্ন, কাজ করার জন্য একটি উচ্চ-সম্পন্ন কম্পিউটারের প্রয়োজন হয় না এবং একটি একক Nvidia V100 দিয়ে দুই মিনিটেরও কম সময়ে একটি মডেল তৈরি করতে পারে।

ওপেনএআই, এআই-চালিত চ্যাটজিপিটি চ্যাটবট এবং ডল-ই টেক্সট-টু-ইমেজ জেনারেটরের পিছনে কোম্পানি, একটি নতুন টুল প্রকাশ করেছে যা সাধারণ পাঠ্য ইনপুটের উপর ভিত্তি করে 3D অবজেক্ট তৈরি করতে পারে। ডাবড পয়েন্ট-ই, এর ওপেন সোর্স গিথুবে উপলব্ধ, যদিও এটি চেষ্টা করা কিছুটা জটিল কারণ ব্যবহারকারীদের কমান্ড-লাইন সরঞ্জামগুলির সাথে ভালভাবে পারদর্শী হতে হবে এবং সিস্টেমের জন্য পাইথন প্রয়োজন, ChatGPT এর বিপরীতে। , যেখানে ব্যবহারকারীরা সাইন আপ করতে পারেন। একটি ওয়েবসাইটে যান এবং এর ক্ষমতা পরীক্ষা করুন।

Point-E-এর বিকাশকারীরা একটি গবেষণাপত্রও প্রকাশ করেছে যা ব্যাখ্যা করে যে প্ল্যাটফর্মটি কীভাবে কাজ করে এবং এর সীমাবদ্ধতাগুলি কী কী। তারা দাবি করে যে Point-E, অন্যান্য 3D ইমেজ জেনারেটর থেকে ভিন্ন, কাজ করার জন্য একটি উচ্চ-সম্পন্ন কম্পিউটারের প্রয়োজন হয় না এবং একটি একক Nvidia V100 GPU দিয়ে দুই মিনিটেরও কম সময়ে একটি মডেল তৈরি করতে পারে।

পয়েন্ট-ই কিভাবে কাজ করে?

সহজ কথায়, OpenAI-এর Dull-E-এর মতো, Point-E ইংরেজিতে সাধারণ কমান্ড সহ 3D মডেল তৈরি করতে পারে। কাগজটি কিছু উদ্ভট উদাহরণ দেখায় যেমন “লাল সান্তা টুপি পরা একটি করগি”, “একটি বহুরঙের রংধনু কুমড়া”, “এক জোড়া 3D চশমা”, এবং “একটি অ্যাভোকাডো চেয়ার, একটি অ্যাভোকাডো অনুকরণ করে একটি চেয়ার।” যদিও টুলটি প্রথাগত অর্থে একটি 3D মডেল তৈরি করে না, এটি একটি 3D আকৃতির প্রতিনিধিত্ব করে এমন অনেকগুলি ডেটা পয়েন্ট তৈরি করে। টুলটি ইতিমধ্যেই বিশ্লেষণ করা “কয়েক মিলিয়ন 3D মডেল” এর উপর ভিত্তি করে ইনপুট বিশ্লেষণ করার পরে চূড়ান্ত আউটপুট প্রক্রিয়া করে।

“পয়েন্ট ই: জটিল সংকেত থেকে 3D পয়েন্ট ক্লাউড তৈরি করার জন্য একটি সিস্টেম” শিরোনামের কাগজে লিখেছেন। একটি পাঠ্য প্রম্পট থেকে একটি 3D অবজেক্ট তৈরি করতে, আমরা প্রথমে একটি টেক্সট-টু-ইমেজ মডেল ব্যবহার করে একটি চিত্রের নমুনা এবং তারপর নমুনা করি। একটি 3D বস্তু নমুনা ইমেজ অপ্টিমাইজ করা হয়. এই উভয় পদক্ষেপই কয়েক সেকেন্ডের মধ্যে সম্পন্ন করা যেতে পারে, এবং ব্যয়বহুল অপ্টিমাইজেশন পদ্ধতির প্রয়োজন হয় না। গবেষণা পত্র অনুসারে, পয়েন্ট-ই দক্ষতার সাথে একটি পাঠ্য প্রম্পটে শর্তযুক্ত বিভিন্ন এবং জটিল 3D আকার তৈরি করতে সক্ষম। টেক্সট-টু-3ডি সংশ্লেষণের ক্ষেত্রে আরও কাজের জন্য আমাদের পদ্ধতি একটি সূচনা বিন্দু হিসাবে কাজ করতে পারে। মজার বিষয় হল, Point-E-এর গবেষকরা কাগজটি লেখার জন্য OpenAI এর ChatGPT ব্যবহার করেছেন।

বিকাশকারীরা দাবি করেন যে পয়েন্ট-ই দ্বারা উত্পন্ন 3D অবজেক্টগুলি ভার্চুয়াল রিয়েলিটি, গেমিং এবং শিল্প নকশার মতো বিস্তৃত অ্যাপ্লিকেশনগুলিতে প্রচুর সহায়তা করতে পারে।

পয়েন্ট-ই এর সীমাবদ্ধতা

2D ইমেজ জেনারেটর ডাল-ই এর মতো, পয়েন্ট-ইও ইনপুট বিশ্লেষণ করতে ব্যর্থ হয় এবং এর চূড়ান্ত আউটপুট কম রেজোলিউশনে প্রদর্শিত হয়। উপরন্তু, চূড়ান্ত আউটপুট “মাইক্রোস্কোপিক আকৃতি বা টেক্সচার” ক্যাপচার করে না। কিন্তু পয়েন্ট-ই কৌশলটি উন্নত করা যেতে পারে কারণ এটি আরও বাস্তব-বিশ্বের চিত্র বিশ্লেষণ করে। একবার সিস্টেমটি উন্নত হয়ে গেলে, এটি কার্যকরভাবে Google-এর ড্রিম ফিউশনকে চ্যালেঞ্জ করতে পারে, যা আরও সঠিক ফলাফল দেয় কিন্তু শক্তিশালী হার্ডওয়্যার প্রয়োজন।

(Feed Source: prabhasakshi.com)