ক্যাটালা একটি নতুন ডোমেন-নির্দিষ্ট ভাষা যা আইনী নথি থেকে অ্যালগরিদম তৈরি করতে পারে, কোড এবং আইনের মধ্যে উচ্চ বিশ্বস্ততা নিশ্চিত করে।
ভাষাটি আইনের যৌক্তিক কাঠামো প্রতিফলিত করার জন্য নির্মিত হয়েছে, এটি আইনী পেশাদারদের দ্বারা পর্যালোচনা এবং শংসাপত্রের জন্য অ্যাক্সেসযোগ্য করে তোলে; এমনকি এটিতে একটি কম্পাইলার রয়েছে যা আইনজীবী-পঠনযোগ্য পিডিএফ তৈরি করে।
ফরাসি লিগ্যালটেকের অগ্রদূত পিয়েরে কাতালার নামে নামকরণ করা, ক্যাটালা প্রকল্পটি ফ্রান্সের ন্যাশনাল রিসার্চ ইনস্টিটিউট ফর কম্পিউটার সায়েন্সের ইনরিয়া র নেতৃত্বে একটি গবেষণা উদ্যোগ। যাইহোক, কম্পাইলার অস্থিতিশীল এবং বৈশিষ্ট্য-সীমাবদ্ধ থাকে।
কথোপকথনটি আইন এবং আইনী নথিগুলি নির্দিষ্ট করার ক্ষেত্রে ক্যাটালা, একটি প্রোগ্রামিং ভাষা ব্যবহারের উপর দৃষ্টি নিবদ্ধ করে, এর সুবিধা, অসুবিধা এবং ইংরেজিকে একটি আনুষ্ঠানিক লজিক সিস্টেমে অনুবাদ করার সম্ভাব্য চ্যালেঞ্জগুলির উপর জোর দে য়।
নিয়ন্ত্রক হিসাবে কোডের ব্যবহার, আইনী কোডের জটিলতা, আইনী চুক্তিতে কোডিং চিহ্নগুলির ব্যবহার এবং প্রোগ্রামিং ভাষা ব্যবহার করে আইনগুলিতে এনকোডিং অভিপ্রায়ের ধারণা সম্পর্কে একটি বিতর্ক রয়েছে।
অংশগ্রহণকারীরা স্পষ্ট আইনী পাঠ্য লেখার ধারণা, আইনি চুক্তির জন্য একটি ডোমেন-নির্দিষ্ট ভাষার ভূমিকা, আইনি ব্যবস্থার সাথে সফ্টওয়্যার বিকাশের তুলনা এবং এই জাতীয় প্রোগ্রামিং ভাষাগুলির জন্য নাম পছন্দ সম্পর্কে উদ্বেগ নিয়ে আলোচনা করেছিলেন।
পেটলস এমন একটি প্ল্যাটফর্ম যা ব্যবহারকারীদের ভোক্তা-গ্রেড জিপিইউ বা গুগল কোলাব ব্যবহার করে তাদের ডিভাইসে বড় ভাষার মডেল - যেমন লামা 2, ফ্যালকন এবং ব্লুম পরিচালনা করতে সক্ষম করে।
প্ল্যাটফর্মটি তার ব্যবহারকারীদের মডেলের বিভিন্ন অংশ পরিবেশন করার জন্য একটি নেটওয়ার্কে যোগদান করতে এবং বিভিন্ন কাজের জন্য মডেলগুলি মানিয়ে নিতে দেয়, পাইটর্চ এবং হাগিং ফেস ট্রান্সফরমারগুলির সাথে একটি এপিআই এবং নমনীয় বিকল্প উভয়ই সরবরাহ করে।
বিগসায়েন্স গবেষণা কর্মশালায় প্যাটালসের প্রকল্পটি তুলে ধরা হয়েছে, যা ভাষা মডেল বিকাশের ক্ষেত্রে এর উল্লেখযোগ্য অবদানকে আরও নির্দেশ করে।
নিবন্ধটি বিটটরেন্ট-স্টাইল পদ্ধতি ব্যবহার করে বাড়িতে বড় ভাষা মডেল (এলএলএম) চালানোর সম্ভাব্যতা পরীক্ষা করে, কম্পিউট রিসোর্সগুলি একত্রিত করে, ডেরিভেটিভ মডেল তৈরি করে এবং প্যারামিটার দক্ষ ফাইন-টিউনিং এবং এলওআরএ পদ্ধতি ব্যবহার করে।
বড় মডেলগুলির প্রশিক্ষণের সাথে সম্পর্কিত অসুবিধা এবং ব্যয়গুলি জল শীতলকরণ এবং পুরানো সার্ভার কার্ডগুলি সংশোধন করার মতো সম্ভাব্য সমাধানগুলির সাথে আলোচনা করা হয়েছে। বিকেন্দ্রীভূত কম্পিউটিং এবং ফাইন-টিউনিং মডেলগুলির মতো ধারণাগুলিও সম্বোধন করা হয়।
অংশগ্রহণকারীদের মধ্যে মিশ্র পর্যালোচনাসহ নিম্ন-শেষ ডিভাইসগুলিতে এলএলএম চালানোর জন্য একটি পরিষেবা পেটালসের উল্লেখ রয়েছে। এই অংশটি ভবিষ্যতে ওপেন-সোর্স এলএলএমগুলিকে সমর্থন করার জন্য টোকেন এবং বিকেন্দ্রীভূত কম্পিউটিংয়ের সম্ভাব্য ব্যবহার সম্পর্কে অনুমান করে।