Comjagat.com-The first IT magazine in Bangladesh
  • ভাষা:
  • English
  • বাংলা
হোম > ইউনিকোডের সদস্যপদ আরো একটি মাইলফলক
লেখক পরিচিতি
লেখকের নাম: মোস্তাফা জব্বার
মোট লেখা:১২৮
লেখা সম্পর্কিত
পাবলিশ:
২০১০ - জুলাই
তথ্যসূত্র:
কমপিউটার জগৎ
লেখার ধরণ:
ইউনিকোড
তথ্যসূত্র:
উত্তরন
ভাষা:
বাংলা
স্বত্ত্ব:
কমপিউটার জগৎ
ইউনিকোডের সদস্যপদ আরো একটি মাইলফলক

মাত্র বারো হাজার ডলারের জন্য বছরের পর বছর অপেক্ষা করেছি আমরা। বাংলাদেশ রাষ্ট্র তার একমাত্র রাষ্ট্রভাষা বাংলার জন্য এই পরিমাণ টাকা ব্যয় করতে পারেনি। শেষ পর্যন্ত বঙ্গবন্ধুকন্যা জননেত্রী শেখ হাসিনার সরকার এবং স্থপতি ইয়াফেস ওসমানের মন্ত্রিত্বের সময়ে সে স্বপ্নের সিঁড়ি আমরা পার হলাম। প্রায় তেইশ বছর পর বাংলাদেশ সরকার ইউনিকোড কনসোর্টিয়ামের সদস্য হলো। অন্তত আরো ১৮ বছর আগে এই সদস্যপদ পাওয়া অতি প্রয়োজন ছিল। গত ৩০ জুন ২০১০ ইউনিকোড কনসোর্টিয়াম বাংলাদেশ সরকারকে সদস্যপদ দান করে এবং ১ জুলাই ২০১০ থেকে এ সদস্যপদ কার্যকর হয়। প্রাথমিকভাবে এক বছরের জন্য বাংলাদেশ বারো হাজার ডলার সদস্য চাঁদা দিয়েছে এবং প্রতি বছর বার্ষিক চাদা পরিশোধ করে এই সদস্যপদ নবায়ন করা সম্ভব হবে। ১৮ মার্চ ২০১০ ইউনিকোড সদস্যপদের জন্য আবেদন করে ৩০ জুনের মাঝে সদস্যপদ পাওয়া নিঃসন্দেহে একটি বড় ধরনের মাইলফলক অর্জন। এর ফলে প্রমাণিত হলো, আন্তরিকতা থাকলে কোন কাজই অসম্ভব নয়।

ইউনিকোড কনসোর্টিয়াম হলো মার্কিন যুক্তরাষ্ট্রে অবস্থিত একটি অলাভজনক সংস্থা। এর সূচনা ১৯৮৬ সালে হলেও এর জন্ম ১৯৮৭ সালে। ১৯৮৮ সালে এটি মোটামুটি একটি রূপ পরিগ্রহ করে। ১৯৯১ সালের জানুয়ারিতে ইউনিকোড ইনকর্পোরেটেড হয়। র্যাাঙ্ক জেরক্সের জো বেকার এবং অ্যাপল কমপিউটারের লি কলিন্স ও মার্ক ডেভিস প্রাথমিক আলোচনার মধ্য দিয়ে ইউনিকোডের যাত্রা শুরু করেন। মূলত র্যাংঙ্ক জেরক্স ও অ্যাপল কমপিউটারের উদ্যোগ হলেও এটি এখন সারা দুনিয়ার ভাষাসমূহের ডিজিটাল যন্ত্রের মান নির্ণয় করে থাকে।

ইতিহাসের পাতায় চোখ রাখলে জানা যাবে, ইউনিকোড শব্দটির উৎপত্তি জো বেকারের হাতে। তিনি from unique, universal, and uniform character encoding এর বিবেচনায় এই নামটি রাখেন। বস্ত্তত এর প্রথম মানটি তৈরি করার কাজ শুরু হয় ১৯৮৬ সালে। কিন্তু সে সংস্করণটি প্রস্ত্তত করতে সময় লাগে ছয় বছর। তাই ১৯৯২ সালের জুনে প্রথম সংস্করণটি প্রকাশিত হয়। এর মাঝে ইউনিকোডের ৫টি সংস্করণ প্রকাশিত হয়েছে। ২০১০ সালের জুলাই মাসে ইউনিকোডের ৫.২ সংস্করণ অনুমোদিত আছে। এর ৬.০ সংস্করণ এখন আলোচনার টেবিলে। ধীরে ধীরে এই সংস্করণটি অনুমোদিত হয়ে যাবে। ইউনিকোড ওয়েবসাইট থেকে পাওয়া তথ্য অনুসারে এর ৬.০ সংস্করণের জন্য মোট ১,০৯,২৪১টি গ্রাফিক্স, ১৪২টি ফরমেট, ৬৫টি কন্ট্রোল, ১৩৭৪৬৮ টি ব্যক্তিগত ব্যবহার, সারোগেট ২০৪৮, নন ক্যারেক্টার ৬৬ এবং ৮,৬৫,০৮২ টি সংরক্ষিত কোড রয়েছে। এতে ২০৮৭টি নতুন অক্ষর যোগ করা হয়েছে। তিনটি নতুন লেখন পদ্ধতি যুক্ত হয়েছে, যার মাঝে একটি হচ্ছে ব্রাহ্মী-বাংলালিপির উৎপত্তিস্থল। বলা যেতে পারে, প্রতিটি সংস্করণেই এর ব্যাপক উন্নয়ন সাধিত হয় এবং বিশ্বের ভাষাসমূহ ডিজিটাল যুগে ব্যবহার হবার নতুন নতুন প্রযুক্তির সন্ধান পায়। সবচেয়ে উল্লেখযোগ্য বিষয় হলো, বিশ্ব মান সংস্থা আইএসও ডিজিটাল যন্ত্রের মান নির্ণয়ে শুধু এই সংস্থাটির সাথেই কাজ করে।

কমপিউটারের যারা আদি ব্যবহারকারী তারা জানেন, এই ডিজিটাল যন্ত্রটি একেবারে শুরুতে রোমান হরফ ছাড়া আর কোনো হরফ বুঝত না। কমপিউটারের আন্তর্জাতিক প্রথম কোড ছিলো ১২৮টি। ০ থেকে ১২৭ পর্যন্ত বিসত্মৃত এই কোডমালায় শুধু রোমান হরফ। সোজা কথায় শুধু রোমান হরফের মূল অক্ষরগুলো লেখা যেতো। ইংরেজি ছাড়া অন্য ভাষার বর্ণগুলোও তাতে লেখা যেত না। এরপর এ সংখ্যা বাড়িয়ে করা হয় ২৫৬টি। প্রথম ১২ কে আসকি ও পরের ১২৮সহ ২৫৬টিকে বলা হয় এক্সটেন্ডেড আসকি। ইউনিকোড মান জন্ম নেবার আগে পর্যন্ত এই মোট ২৫৬টি কোড দিয়ে কমপিউটারে লেখা যেতো। কোনো কোনো যন্ত্র, যেমন ফটোটাইপসেটার এর বাইরের কোড ব্যবহার করলেও সেইসবের কোনো মান ছিলো না। এ কারণেই রোমান হরফ যারা ব্যবহার করে না তারা ছাড়া অন্য কারও পক্ষে তাদের নিজের ভাষা কমপিউটারে লেখা সম্ভব ছিলো না। র্যা্ঙ্ক জেরক্স কোম্পানি সেই ২৫৬টি কোডসীমা অতিক্রম করার চেষ্টা করলেও একই সমান কোড বহাল রেখে রোমান ভাষার পাশাপাশি অন্য ভাষা ব্যবহারের সহজ সুযোগ আসে ১৯৮৪ সালে জন্ম নেয়া মেকিন্টোস কমপিউটারে। ১৯৮১ সালে জন্ম নেয়া আইবিএম পিসির জন্য প্রণীত ডস অপারেটিং সিস্টেমেও রোমান হরফের কোড সীমানায় অন্য ফন্ট এবং সেই সুবাদে অন্য ভাষা ব্যবহার করা যেতো। কিন্তু প্রক্রিয়াটি জটিল ছিলো বলে অ্যাপল কমপিউটার কোম্পানির মেকিন্টোস কমপিউটার ডেস্কটপ বিপক্ষে অগ্রনায়কের ভূমিকা পালন করে। অ্যাপলের গ্রাফিক্যাল ইউজার ইন্টারফেস এবং কুইক ড্র অ্যাপ্লিকেশনগুলো খুব সহজে গ্রাফিক্স পদ্ধতিতে রোমান ছাড়া অন্য ভাষার বর্ণমালা উৎপন্ন করতে শুরু করে। মাল্টিপল ফন্ট ব্যবহারের প্রযুক্তিও এজন্য সহায়তা করেছে। ফলে ডস অপারেটিং সিস্টেমে বাংলা প্রয়োগ করার চেষ্টা আশির দশকের শুরুতে করা হলেও বস্ত্তত অ্যাপল মেকিন্টোস কমপিউটারেই প্রথম বাংলা ভাষা সঠিক ও সুন্দরভাবে লেখা হয়। ১৯৮৭ সালের ১৬ মে প্রকাশিত হয় কমপিউটারে কম্পোজ করা প্রথম বাংলা পত্রিকা-আনন্দপত্র। পরে ১৯৯৩ সালে উইন্ডোজ-এর হাত ধরে মেকিন্টোসের সেই প্রযুক্তি পিসিতে আসে। শুধু ইন্টারনেট ছাড়া অন্য সব কাজেই আমরা এখনো সে প্রযুক্তিই ব্যবহার করছি। কিন্তু দুঃখজনক হলো, এখন এমনকি ম্যাক ও পিসিতে একই এনকোডিং ব্যবহার করা সম্ভব হচ্ছে না।

২৫৬ কোডের আসকি কোড সেট নিয়ে বাংলা লেখার প্রধান অসুবিধা দুটি। প্রথমত বাংলা বর্ণের সংখ্যা অনেক বেশি। ২৫৬ কোডের মাঝে সর্বোচ্চ ২২০টি কোড ব্যবহার করে বাংলা সব যুক্তাক্ষর অবিকৃতভাবে লেখা অসম্ভব। এতে বর্ণসমূহের সৌন্দর্য রক্ষা করা কঠিন হয়ে পড়ে। বেশিরভাগ বর্ণকে সঠিকভাবে উৎপন্ন করা গেলেও অনেক বর্ণ তার প্রকৃতরূপে দেখা যায় না। ফলে যখনই আমরা বাংলা হরফের বিষয়টি পর্যালোচনা করি, তখনই দেখি যুক্তাক্ষরগুলো তার আদি রূপ হারিয়ে ফেলছে বা নানা ধরনের অক্ষরাংশ দিয়ে তৈরি হচ্ছে বলে যথাযথভাবে সেটি উৎপন্ন হচ্ছে না। বাংলা হরফে যেহেতু শুধু বর্ণ নয় চিহ্নও আছে, সেহেতু সেগুলো সঠিকভাবে বর্ণসমূহের সাথে যুক্ত হচ্ছে কি না তাও দেখার বিষয়। বাস্তবতা হলো ২৫৬টি কোডে বাংলা সঠিকভাবে লেখা সম্ভব নয়। আমরা যারা বাংলা হরফ তৈরি করি, তারা কার্যত আপোষ করি। একে মন্দের ভালো বলা যায়।

আসকি কোডের দ্বিতীয় অসুবিধা হলো, বাংলা ভাষার জন্য এর কোনো মান নেই। বাংলাদেশের বিএসটিআই এক সময়ে বাংলার জন্য একটি মান তৈরির চেষ্টা করে ব্যর্থ হয়। যদিও ২০০০ সালে একটি মান তৈরি হয় তবুও সেটি আসকিভিত্তিক ছিলোনা। অন্যদিকে বেসরকারি সফটওয়্যার নির্মাতারা নিজেরা একেকটি মান তৈরি করে বলে একাধিক মানের জন্ম হয়েছে। এজন্য বাংলাদেশের একাধিক মান, পশ্চিমবঙ্গের একাধিক মান এবং আসাম, ত্রিপুরার মানগুলো নিয়ে আমরা ব্যাপকভাবে সঙ্কটে পড়েছি। যদিও বাংলাদেশে ‘বিজয়’-এর মান অনেকটাই প্রচলিত, তবুও অন্য মানগুলোর কথা একেবারে অস্বীকার করা যাবে না।

খুব বেশি গুরুত্বপূর্ণ না হলেও তৃতীয় আরেকটি সমস্যা হলো; একই কোড ইংরেজি ও বাংলা ব্যবহার করে বলে ফন্ট পরিবর্তনের সাথে সাথে ভাষাও বদলে যেতে পারে। বাংলা-ইংরেজি মিশ্রিত দলিলে এটি বেশ বড় ধরনের সমস্যা তৈরি করে।

ইউনিকোড মান আমাদের এসব সমস্যার সমাধান দিয়েছে। যদিও ইউনিকোড মানে শুধু মূল বর্ণগুলোর মান রয়েছে এবং আমাদের যুক্তবর্ণকে কোনো মান দেয়া হয়নি, তথাপি ওপেনটাইপ নামের একটি প্রযুক্তি দিয়ে আমরা অক্ষরের সংখ্যা যেকোনো পর্যায়ে নিয়ে যেতে পারি। ফলে অক্ষরের আকার-আকৃতি নিয়ে যে সমস্যা আসকিতে রয়েছে, সেটি আর থাকে না। ইউনিকোড যেহেতু সবার কাছে গ্রহণযোগ্য সেহেতু এর মান নিয়ে কোনো প্রশ্ন উঠছে না। বাংলাদেশে ইউনিকোড মান সরকারি স্বীকৃতি পেয়েছে। এমনকি পশ্চিমবঙ্গেও এটি স্বীকৃতি পেয়েছে। পশ্চিমবঙ্গের যে সংস্থাটি ইউনিকোডের সদস্য তাদের মন্তব্য হলো, Data Representation and Encoding Standard: Society for Natural Language Technology Research has decided to accept UNICODE 5.0 and upwards as the standard for data representation and encoding for Bangla.

এর মানে হচ্ছে বাংলাদেশের একটি টেক্সট ভারতের পশ্চিমবঙ্গেও একইভাবে কোন পরিবর্তন ছাড়া ব্যবহার করা যাবে। অন্যদিকে ইউনিকোডের মানে যেহেতু ভাষাগুলোর কোডিং আলাদা সেহেতু কোন টেক্সট-এর ফন্ট বদলালে সেটির ভাষাও বদলে যায় না।

তবে একটি কথা স্পষ্ট করে বলা দরকার আমরা এখনো ইউনিকোড এনকোডিংয়ের সব সুবিধা ভোগ করতে পারি না। কারণ, মাইক্রোসফট ছাড়া অন্য সফটওয়্যার নির্মাতারা ইউনিকোড পরিপূর্ণভাবে সমর্থন করে না। এমনকি ইউনিকোড মানটি মাইক্রোসফটও সঠিকভাবে বাংলার জন্য প্রয়োগ করেনি। ফলে বিশেষ করে মুদ্রণ ও প্রকাশনার কাজ যারা করেন, তারা ইউনিকোডকে ব্যবহার করতে পারেন না। যেহেতু আসকি কোডে বাংলা লেখার অনেক জটিলতা রয়েছে, সেহেতু ইউনিকোড ব্যবহার করে প্রকাশনার কাজ করতে পারলে অবশ্যই খুব ভালো হতো। কিন্তু আমাদের প্রয়োজনীয় সফটওয়্যার যেমন ফটোশপ, ইলাসট্রেটর, কোয়ার্ক, ইনডিজাইন এসব কোনভাবেই ইউনিকোডের যুক্তাক্ষর দেখাতে পারেনা। কিন্তু আমাদের জন্য এই কাজগুলো সম্পন্ন করা খুবই জরুরি। এজন্য হয় আমাদেরকে এসব অ্যাপ্লিকেশনকে ইউনিকোড সমর্থন করাতে হবে, নইলে বিকল্প কোন পথে ইউনিকোড প্রযুক্তির যুক্তাক্ষর ব্যবস্থা ব্যবহার করতে হবে। দিনের পর দিন এসব বিষয় নিয়ে আলোচনা হয়েছে, কিন্তু কোন উদ্যোগ সরকারিভাবে নেয়া হয়নি। বরং এই প্রশ্ন তোলা হয়েছে, আমরা কেনো ইউনিকোডের সদস্য হবো। তার উত্তরে অত্যন্ত বিনয়ের সাথে আমি একথা বলবো, আমাদের ইউনিকোডের সদস্যপদ অনেক জরুরি। এর প্রথম কারণ হচ্ছে, বাংলা আমাদের রাষ্ট্রভাষা। ফলে এই ভাষার মান নির্ণয়ের ক্ষেত্রে আমরা নীরব থাকতে পারি না। স্মরণ করতে পারি, শুরু থেকেই ইউনিকোড মান যখন নির্ধারিত হতে থাকে তখন বাংলাদেশের প্রতিনিধিত্ব ছিল না বলে তাতে আমরা যেভাবে বাংলা লিখি এবং আমাদের যেসব হরফের খুবই প্রয়োজন, সেগুলো ইউনিকোড অন্তর্ভুক্ত করেনি। প্রধানত হিন্দীর অনুকরণে বাংলার প্রমিত করা হয়। ফলে প্রথম দিকের সংস্করণগুলোতে আমাদের ড়, ঢ়, য় ও ৎ ছিল না। ইউনিকোডে এসব অক্ষর প্রবেশ করতে অনেক সময় লেগেছে। আমি স্মরণ করতে পারি, থাইল্যান্ডে যখন আমি ইউনিকোডের প্রথম সংস্করণের নমুনা দেখি, তখন স্পষ্টতই বাংলাকে হিন্দীর অনুগত মনে হয়। সেখানে প্রতিবাদ করার ফলে প্রথম সংস্করণ চূড়ান্ত করার আগেই অনেক অগ্রগতি হয়। তবে এখন পর্যন্ত ইউনিকোড আমাদের দাড়ি এবং দুই দাড়ি বাংলার কোড হিসেবে গ্রহণ করেনি। বাংলায় দাড়ি ও ডাবল দাড়ি ব্যবহার করার মানে হচ্ছে দেবনাগরী কোড ব্যবহার করা। অথচ ব্রাহ্মীলিপি থেকে উৎপত্তি হওয়া অন্য অনেক ভাষায় আলাদাভাবে দাড়ি ও ডাবল দাড়ি অন্তর্ভুক্ত আছে। এখনও পর্যন্ত ইউনিকোড দিয়ে সঠিকভাবে বাংলা লেখা যায় না। কারণ, সেখানে আমাদের বাংলা লেখার বেশ কিছু সঙ্কট রয়ে গেছে। বাংলা সর্টিং থেকে শুরু করে য ফলা ও রেফ সংক্রান্ত বিষয়টিরও মীমাংসা হওয়া উচিত।

আমাদের পক্ষ থেকে সরকারকে আমরা বারবার এই কথা বলে এসেছি, সরকার যদি ইউনিকোড কনসোর্টিয়ামের পূর্ণ সদস্য হিসেবে যোগ দিতে না পারে তবে বাংলা ভাষা নিয়ে যেসব সমস্যায় আছি আমরা সেই সম্পর্কে আন্তর্জাতিক এই সংস্থাটিকে কিছুই জানানো যাবে না। কার্যত সেটি হয়নি। যেহেতু তাদের মানই আমাদেরকে গ্রহণ করতে হচ্ছে, সেহেতু আমরা যদি এই সংস্থার বোর্ডে বসতে না পারি, কারিগরি কমিটিতে না থাকি, তবে বাংলার সমস্যা থেকেই যাবে। ভারত সরকার গোড়া থেকেই এই সংস্থার সদস্য। এমনকি ভারতের পশ্চিমবঙ্গ রাজ্য সরকার এই সংস্থার সদস্য। পাকিস্তান এই সংস্থার সদস্য ছিল। বিশ্বের প্রায় সব বড় বড় কমপিউটার প্রতিষ্ঠান এই সংস্থার সদস্য। ফলে আমরা যদি বাংলা ভাষার জন্য কোনো প্রস্তাব পেশ করতে চাই, তবেও এর সদস্য হওয়া বাঞ্ছনীয়। এতোদিন ভারত বা পশ্চিমবঙ্গ রাজ্য সরকার যা বলতো, সেটিই ছিল বাংলা বিষয়ে ইউনিকোডের কাছে পেশ করা বক্তব্য। এখন আমরা সদস্য হয়েছি বলে আমরা আমাদের কথাও বলতে পারব।

পরিশেষে গুরুত্ব দিয়ে বলা দরকার, শুধু ইউনিকোড কনর্সোটিয়ামের সদস্য হওয়াটাই মূল লক্ষ্য নয়। সদস্য হয়ে যদি ঘরে বসে হাত পা গুটিয়ে রাখি, তবে যে চাঁদাটা শোধ করা হলো সেটিও বিফলে যাবে। আমাদের দেশে এমন হয়, এসব সংস্থার সম্মেলন বা বৈঠকে আমলারা যোগ দেয়, যারা বস্ত্তত এইসব বিষয়ের কিছুই জানেন না। তারা বিদেশ সফর করে ঘরে ফিরে আসেন। কিন্তু বিষয়টি যেহেতু ভাষা-হরফ-প্রযুক্তি সংক্রান্ত সেহেতু এসব বিষয়ে যারা বিশেষজ্ঞ তাদের মধ্য থেকে যদি এই সংস্থায় প্রতিনিধিত্ব করা না হয়, তবে সদস্য হবার যে উদ্দেশ্য তা পূরণ হবে না। আমি আশাবাদী, আমাদের সরকার সেভাবেই সামনে পা ফেলবেন।

কজ ওয়েব

ফিডব্যাক : mustafajabbar@gmail.com
পত্রিকায় লেখাটির পাতাগুলো
লেখাটি পিডিএফ ফর্মেটে ডাউনলোড করুন
লেখাটির সহায়ক ভিডিও
চলতি সংখ্যার হাইলাইটস