সাধারণ মানুষ তো বটেই এমনকি শিক্ষা সংশ্লিষ্ট নীতিনির্ধারক ও শিক্ষাবিদ অনেকের মাঝেই একটি ভুল ধারণা প্রচলিত আছে যে, টার্নিটিন হচ্ছে একাডেমিক গবেষণায় প্ল্যাজারিজম বা চৌর্যবৃত্তি শনাক্তকরণ সফটওয়্যার। এটিকে মূলত একটি ‘টেক্সট-ম্যাচিং টুল’ হিসেবে ধরা যায়, যা বিভিন্ন ওয়েবসাইট ও ইন্টারনেটে রক্ষিত ডেটাবেসের বিপরীতে অনুরূপ টেক্সট এর সাদৃশ্যসমূহ নিরূপণ করে থাকে। এছাড়া টার্নিটিন নিজেও সরাসরি দাবি করে না এটি প্ল্যাজারিজম বা চৌর্যবৃত্তি শনাক্তকরণ টুল।

একাডেমিক গবেষণায় প্ল্যাজারিজম বা চৌর্যবৃত্তি শনাক্তকরণ একটি সম্পূর্ণ একাডেমিক ও স্পর্শকাতর বিষয়, যা বিভিন্ন ফ্যাক্টর বা বিষয়ের উপর নির্ভর করে এবং সংশ্লিষ্ট বিষয়ে বিশেষজ্ঞরা কেবলমাত্র এই কাজটি করতে পারেন। টার্নিটিন বা অনুরূপ সফটওয়্যার শুধুমাত্র সিমিলারিটি ইনডেক্স বা সাদৃশ্য সূচকের উপর ভিত্তি করে যে ধরনের ‘অরিজিনালিটি রিপোর্ট’ তৈরি করে, তা অবশ্যই একজন বিষয়ভিত্তিক বিশেষজ্ঞ দ্বারা ব্যাখ্যা করা প্রয়োজন।

টার্নিটিন দ্বারা কোনো একটি গবেষণা বা প্রকাশিত নিবন্ধের ‘অরিজিনালিটি রিপোর্ট’ তৈরি করার আগে উক্ত গবেষণা বা প্রকাশনার রেফারেন্স বা বিব্লিওগ্রাফি (Bibliography), উদ্ধৃত অংশসমূহ, সংক্ষেপণ, গ্রাফ বা ছবি, সারণি, সায়েন্টিফিক বা টেকনিক্যাল ও বহুল প্রচলিত শব্দ বা বাক্যাংশ অবশ্যই বাদ দেওয়া উচিত।

সফটওয়্যার প্রদত্ত শুধুমাত্র সিমিলারিটি ইনডেক্স বা সাদৃশ্য সূচক এর উপর নির্ভর করে প্ল্যাজারিজম বা চৌর্যবৃত্তি নিরূপণে সিদ্ধান্ত গ্রহণ মোটেও বুদ্ধিমানের কাজ নয় বরং এক্ষেত্রে গবেষণা প্রবন্ধের প্রতিটি উপাদান আলাদাভাবে অবশ্যই ম্যানুয়ালি বা ব্যক্তিগতভাবে পরীক্ষা-নিরীক্ষা করা অত্যাবশ্যক। এটি কোনো একক উৎস থেকে নেওয়া হয়েছে নাকি বিভিন্ন উৎসের ছোট ছোট অংশ থেকে সংগ্রহ করা হয়েছে তা ভালোভাবে পর্যালোচনা করে তারপর বিবেচনায় নিতে হবে। এছাড়া মিলে যাওয়া অংশসমূহ উক্ত নিবন্ধে সঠিকভাবে উদ্ধৃত করা হয়েছে কি না তাও খতিয়ে দেখতে হবে।

টার্নিটিন বা অনুরূপ সফটওয়্যার শুধুমাত্র সিমিলারিটি ইনডেক্স বা সাদৃশ্য সূচকের উপর ভিত্তি করে যে ধরনের ‘অরিজিনালিটি রিপোর্ট’ তৈরি করে, তা অবশ্যই একজন বিষয়ভিত্তিক বিশেষজ্ঞ দ্বারা ব্যাখ্যা করা প্রয়োজন।

কখনো কখনো টার্নিটিন দ্বারা যাচাইকৃত সিমিলারিটি ইনডেক্স বা সাদৃশ্য সূচক এর ফলাফল নিজের প্রকাশনা উৎসের সাথেও মিলে যেতে দেখা যায়, যা অনেকক্ষেত্রে ৯০ শতাংশেরও বেশি হতে পারে। এক্ষেত্রে মিলে যাওয়া প্রতিটি উৎস ভালোমতো পরীক্ষা-নিরীক্ষা করে ‘অরিজিনালিটি রিপোর্ট’ বিশ্লেষণ করতে হবে। যদি দেখা যায় যে, মিলিত উৎসটি নিজেই নিজের প্রকাশনা প্রবন্ধ বা তার অংশবিশেষ সেক্ষেত্রে টার্নিটিন দ্বারা চেক করার আগে উক্ত প্রকাশনার উৎসটি সমূলে বাদ দিতে হয়। এছাড়া কোনো একটি গবেষকের পিএইচডি বা গবেষণা থিসিস পেপার যদি ডিগ্রি প্রদানকারী শিক্ষা প্রতিষ্ঠানের গ্রন্থাগার রিপোজিটরিতে সংরক্ষিত থাকে গবেষক তার ব্যক্তিগত বা প্রাতিষ্ঠানিক কোনো সাইটে দিয়ে রাখে অথবা উক্ত থিসিস থেকে এক বা একাধিক জার্নালে আর্টিক্যাল প্রকাশিত হয় এবং সেই আর্টিক্যালগুলো বিভিন্ন সাইটে দেওয়া থাকে অথবা একই লেখা বা তার সারাংশ একাধিক উৎসে জমা থাকে টার্নিটিন তার সবগুলো সামষ্টিক আকারে সিমিলারিটি রিপোর্ট দিয়ে থাকে।

আরেকটি মজার ব্যাপার হলো, টার্নিটিন দ্বারা কোনো একটি প্রবন্ধ চেক করার সময় উক্ত প্রবন্ধটি প্রকাশিত হওয়ার পূর্বাপর সব উৎস থেকে প্রাপ্ত তথ্য প্রদান করে, এক্ষেত্রে পরে প্রকাশিত উৎসগুলো অবশ্যই বাদ দিতে হবে। অনেক সময় এমনটিও লক্ষণীয় যে, একই প্রকাশনা বা গবেষণা প্রবন্ধ ও নিবন্ধ একবার টার্নিটিন দ্বারা চেক করার পর যদি তা টার্নিটিনের রিপোজিটরি বা সংরক্ষণাগার থেকে বাদ দেওয়া না হয় তাহলে পরবর্তীতে উক্ত প্রকাশনা বা গবেষণা প্রবন্ধটির সিমিলারিটি ইনডেক্স বা সাদৃশ্য সূচক ১০০ শতাংশ বা তার কাছাকাছি পাওয়া যাবে।

মজার ব্যাপার হলো, টার্নিটিন দ্বারা কোনো একটি প্রবন্ধ চেক করার সময় উক্ত প্রবন্ধটি প্রকাশিত হওয়ার পূর্বাপর সব উৎস থেকে প্রাপ্ত তথ্য প্রদান করে, এক্ষেত্রে পরে প্রকাশিত উৎসগুলো অবশ্যই বাদ দিতে হবে।

এ বিষয়টি খুবই গুরুত্বপূর্ণ যে, সিমিলারিটি ইনডেক্স বা সাদৃশ্য সূচক দ্বারা প্ল্যাজারিজম বা গবেষণায় চৌর্যবৃত্তি শনাক্তকরণ কতটুকু হয়েছে তা পুরোপুরি বলা যাবে না কারণ সিমিলারিটি ইনডেক্স বা সাদৃশ্য সূচক ও প্ল্যাজারিজম বা চৌর্যবৃত্তি এ দুটি উপাদানের মধ্যে রয়েছে বিশাল পার্থক্য। এটি অনুধাবন করার জন্য একটি উদাহরণ হিসেবে নিম্নলিখিত চিত্রটি খুবই গুরুত্বপূর্ণ। এটা স্পষ্ট যে, এখানে প্রচুর শব্দ, সংক্ষেপণ, পরীক্ষার নাম, রোগ ও উপসর্গ ইত্যাদি রয়েছে। কেউ চাইলেও এগুলোর পরিবর্তন বা প্যারাফ্রেজ করতে পারবে না এবং এক্ষেত্রে পুরো বাক্যটিও অনুরূপভাবেই লিখতে হবে। এখানে টার্নিটিন ৬৪ শতাংশ সিমিলারিটি ইনডেক্স বা সাদৃশ্য সূচক দেখায়, তার মানে ৬৪ শতাংশ প্ল্যাজারিজম বা চৌর্যবৃত্তি হয়েছে ব্যাপারটি কিন্তু তা নয়। এর মানে হলো ইতোমধ্যে প্রকাশিত বিভিন্ন প্রকাশনার সাথে ৬৪ শতাংশ মিলেছে, যার মধ্যে ইন্টারনেটে পাওয়া কোটি কোটি পৃষ্ঠা অন্তর্ভুক্ত থাকতে পারে যাকে ঠিক প্ল্যাজারিজম বা চৌর্যবৃত্তি হিসেবে গণ্য করা যায় না।

(তথ্যসূত্র: সৌদি জার্নাল অব এনেসথেশিয়া, এপ্রিল ২০১৯)

বিশেষজ্ঞরা মনে করেন, নানাবিধ কারণে টার্নিটিন এর মতো সফটওয়্যার এর মাধ্যমে একাডেমিক গবেষণায় প্ল্যাজারিজম বা চৌর্যবৃত্তি শনাক্তকরণ ও মূল্যায়ন করা নৈতিকভাবে প্রশ্নবিদ্ধ ও ত্রুটিযুক্ত কারণ টার্নিটিন বা এ জাতীয় সফটওয়্যার তাদের অসম্পূর্ণ ডেটাবেসগুলোর কারণে প্ল্যাজারিজম বা চৌর্যবৃত্তির প্রতিটি বিষয় সঠিকভাবে শনাক্ত করতে পারে না। এমনকি এ সফটওয়্যার সার্চ ইঞ্জিনের ইনডেক্স বহির্ভূত কোনো প্রকাশনা যেমন ছাপানো গ্রন্থ, সাময়িকী ও পত্রিকার অংশ কিংবা ইংরেজি ছাড়া অন্য কোনো ভাষা যেমন বাংলা ইত্যাদি উৎসের সিমিলারিটি ইনডেক্স বা সাদৃশ্য সূচক শনাক্ত করতে সম্পূর্ণভাবে অক্ষম। সুতরাং টার্নিটিন একটি প্ল্যাজারিজম বা চৌর্যবৃত্তি শনাক্তকরণ সফটওয়্যার বা টুল নয়, তবে এটি একটি পাঠ্য মিলে যাওয়া সরঞ্জাম বা নথির সাদৃশ্য সরবরাহ করে বলা যায়।

ড. মুহাম্মদ খাইরুল আমিন ।। ন্যানো-মেডিসিন গবেষক, গ্রিনিচ বিশ্ববিদ্যালয়, যুক্তরাজ্য