প্রথমত স্পেলচেকিং এর সাথে সাধারন টেক্সট ম্যাচিং এর কিছু পার্থক্য রয়েছে। সাধারণ টেক্সট ম্যাচিং প্রদত্ত শব্দটির সাথে সম্পূর্ণ বা আংশিক ম্যাচ করা শব্দগুলো খুঁজে বের করে। কিন্তু স্পেল চেকিং এধরনের অক্ষরভিত্তিক (লেক্সিকাল) ম্যাচিং এর চাইতে উচ্চারণভিত্তিক (ফোনেটিক) ম্যাচিং বেশী জরুরী। যেমন অক্ষরভিত্তিক ম্যাচিং এ "সাধারন" এ সঠিক বানান "সাধারণ" দেখালেও "শাধারন" এ হয়ত কোন সাজেশন (বা সঠিক সাজেশন) খুঁজে পাবে না। কারন উচ্চারণ একই হলেও বানানে দুটি অক্ষরে ভুল রয়েছে। আর দুটি অক্ষর পরিবর্তন করে অনেক শব্দই সম্ভব। অন্যদিকে উচ্চারণভিত্তিক স্পেলচেকিং উচ্চারণকে গুরুত্ত্ব দিয়ে শব্দ খুঁজে থাকে। যেটি স্পেলচেকিং এ বেশি প্রয়োজন (কারন সাধারনত ভুল বানানেও উচ্চারণ একই থাকে)। এ ব্যাপারে বিস্তারিত আলোচনা পাবেন অরূপ ভাইয়ের এ পোস্টে ।
এবার প্রজেক্টগুলোর কথায় আসি -
১. পুষ্প: বাংলা ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং নিয়ে সম্ভবত সবচেয়ে বড় প্রজেক্ট হচ্ছে ব্র্যাক বিশ্ববিদ্যালয়ের অধীনে চালিত সেন্টার ফর রিসার্চ অন বাংলা ন্যচারাল ল্যাংগুয়েজ প্রসেসিং । সেখানে আমার এক বন্ধু নওশাদ প্রায় দু'বছর কাজ করেছে(বর্তমানে ইউনিভার্সিটি অব রচেস্টার, নিউয়র্ক - এ ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং এর উপর গবেষণা করছে)। তাদেরই বানানো স্পেলচেকারের নাম পুষ্পস্পেলার। স্পেলচেকারসহ প্রোটোটাইপ এডিটরটি এখান থেকে ডাউনলোড করা যাবে।
২. ফায়ারফক্স প্লাগ-ইন: সবার জন্য সুবিধা হত যদি কোন স্পেলচেকার যেকোন ওয়েবসাইটে ব্যবহার করা যেত এবং রানটাইমে স্পেলচেকিং করত। মজিলা ফায়ারফক্সের স্পেলচেকিং ফিচারকে ব্যবহার করে তেমনি একটি প্লাগ-ইন ডেভেলপ করেছে অংকুর বাংলা । অংকুর বাংলার সাথে পরিচয় করিয়ে দিতে গেলে বলতে হয় - বর্তমানে লিনাক্স ডিস্ট্রিবিউসনগুলোতে বাংলা ইন্টারফেস এর পেছনে সবচেয়ে বড় অবদান এ সেচ্ছাসেবক সংস্হার। যাহোক, প্লাগ-ইন টি ইন্সটল এর নিয়মাবলী পাবেন এখানে ।
এই প্লাগ-ইন এর সাথে সহকারী প্লাগ-ইন হিসেবে ডিক্সনারী সুইচার ইন্সটল করে নিবেন। তাহলে প্রয়োজন অনুযায়ী বাংলা ও ইংরেজী স্পেলচেকার পরিবর্তন করতে পারবেন।
ব্যবহার পদ্ধতি: বাংলা টাইপিং এর সময় নিচের ডিক্সনারী সুইচারের অপশন থেকে "bn-BD" সিলেক্ট করে নিন।
এরপর কোন শব্দ ভুল টাইপ করলে তার নিচে লাল আন্ডারলাইন দেখা যবে। সেই শব্দটিতে রাইট ক্লিক করে সঠিক শব্দটি সিলেক্ট করে দিন অথবা শব্দটি ঠিক মনে হলে "Add to dictionary" সিলেক্ট করুন।
বর্তমানে এই ফায়ারফক্স প্লাগ-ইন প্রায় ১,১০,০০০ শব্দ রয়েছে। কিন্তু বেশ কিছু শব্দ ভুল রয়েছে বলেও অভিযোগ রয়েছে। এছাড়া কোন শুদ্ধ শব্দের সাথে প্রকৃতি-প্রত্যয় কিংবা বিভক্তি যোগ করলেও সেটি ভুল দেখায়। কাজেই সেগুলোও যোগ করতে হবে। আপনি চাইলে ডিক্সনারি শুদ্ধকরনে সাহায্য করতে পারেন। এ সম্পর্কে বিস্তারিত পাবেন ইন্সটলেশন ডকুমেন্টে ।আরেকটি অসুবিধা হচ্ছে, এটি ফায়ারফক্স ২ এর জন্য বানানো হয়েছিল। আর আপডেট করা হয়নি। কাজেই ফায়ারফক্স ৩ তে কাজ করবে না।
[বি:দ্র: এটি আমার সামহোয়্যার ইন এ লেখা প্রথম পোস্ট। আলসেমির কারনে প্রায় সময় মন্তব্যই করা হয় না, আবার পোস্ট ]
সর্বশেষ এডিট : ০৪ ঠা সেপ্টেম্বর, ২০০৮ ভোর ৬:৫৭