নির্ভরণ বিশ্লেষণ
চলরাশিসমূহের মধ্যে সম্পর্ক নির্ণয় করার জন্য পরিসংখ্যানিক প্রক্রিয়ার সমষ্টি / From Wikipedia, the free encyclopedia
পরিসংখ্যানিক প্রতিমান নির্মাণে নির্ভরণ বিশ্লেষণ (ইংরেজি: Regression Analysis) হচ্ছে কতগুলো পরিসংখ্যানিক প্রক্রিয়ার সমষ্টি যার মাধ্যমে চলকসমূহের মধ্যে বিদ্যমান সম্পর্ক নির্ণয় করা হয়। কতগুলো চলকের প্রতিমান নির্মাণ (মডেলিং) ও বিশ্লেষণের জন্য এতে অনেকগুলি কৌশল অন্তর্ভুক্ত রয়েছে, যেখানে মূল লক্ষ্য হচ্ছে একটি অধীন চলকের সাথে এক বা একাধিক স্বাধীন চলকের (বা 'সূচক') মধ্যকার সম্পর্ক নির্ণয়। আরও সুনির্দিষ্টভাবে বললে, যে কোনও একটি স্বাধীন চলকের মান পরিবর্তন করলে এবং অন্যান্য স্বাধীন চলকসমূহকে স্থির রাখলে, সাধারণত কীভাবে অধীন চলকটির (বা 'নির্ণায়ক চলক') মানের পরিবর্তন হয়, নির্ভরণ বিশ্লেষণ তা বুঝতে সাহায্য করে।
সচরাচর, নির্ভরণ বিশ্লেষণে স্বাধীন চলকসমূহ দেওয়া থাকলে অধীন চলকটির শর্তসাপেক্ষ সম্ভাব্য মান অনুমান করা হয় --- অর্থাৎ, স্বাধীন চলকগুলির মান স্থির থাকলে অধীন চলকের গড় মান অনুমান করা হয়। অসচরাচরভাবে, স্বাধীন চলক দেওয়া থাকলে অধীন চলকের শর্তসাপেক্ষ বণ্টনের সমাংশক (quantile) বা অন্য কোনও অবস্থানসূচক পরামিতির ওপর মনোযোগ দেওয়া হয়। সবক্ষেত্রেই, স্বাধীন চলকসমূহ নিয়ে গঠিত নির্ভরণ অপেক্ষকের (Regression function "রিগ্রেশন ফাংশন") মান নির্ণয় করতে হয়। নির্ভরণ বিশ্লেষণে আরেকটি আগ্রহের বিষয় হচ্ছে, কোন সম্ভাবনা-বণ্টন পদ্ধতি ব্যবহার করে নির্ভরণ ফাংশনের পূর্বানুমানের সাথে অধীন চলকের মানের ভিন্নতা চিহ্নিত করা। একটি সংশ্লিষ্ট কিন্তু স্বতন্ত্র উপায় হচ্ছে আবশ্যকীয় শর্ত বিশ্লেষণ (NCA: Necessary Condition Analysis)[1], যা স্বাধীন চলকের কোন্ মানটি, অধীন চলকের কোন প্রদত্ত মানের জন্য আবশ্যকীয়, কিন্তু পর্যাপ্ত নয়- তা শনাক্ত করার জন্য, স্বাধীন চলকের কোন প্রদত্ত মানের প্রেক্ষিতে, অধীন চলকের সর্বোচ্চ মান (গড় মানের পরিবর্তে) অনুমান করে (সিলিং রেখা বা সর্বোচ্চ-সীমা রেখা, মধ্যবর্তী রেখা নয়)।
পূর্বানুমান ও ভবিষ্যদ্বাণী করার জন্য নির্ভরণ বিশ্লেষণ ব্যাপকভাবে ব্যবহৃত হয়, যেখানে এর ব্যবহারের সাথে মেশিন লার্নিং ক্ষেত্রটির যথেষ্ট মিল রয়েছে। নির্ভরণ বিশ্লেষণ ব্যবহার করে, স্বাধীন চলকগুলির কোনগুলো আসলে অধীন চলকের সাথে সম্পর্কিত, এবং এই সম্পর্কগুলোর রূপ অনুসন্ধান করা যায়। সীমাবদ্ধ ক্ষেত্রে, স্বাধীন ও অধীন চলকের মধ্যে কার্যকারণ সম্পর্ক (causal relationships) অনুমান করার জন্য নির্ভরণ বিশ্লেষণ ব্যবহার করা যেতে পারে। তবে, এ থেকে ভ্রান্ত বা মিথ্যা সম্পর্ক পাওয়া যেতে পারে, সুতরাং সতর্কতা অবলম্বন করা সমীচীন।
নির্ভরণ বিশ্লেষণের জন্য অনেকগুলো পদ্ধতির বিকাশ ঘটেছে। পরিচিত পদ্ধতি যেমন, রৈখিক নির্ভরণ এবং সাধারণ লঘিষ্ট বর্গ নির্ভরণ হচ্ছে পরামিতিক, এই অর্থে যে, সেখানে নির্ভরণ ফাংশনকে কতগুলো অজানা পরামিতির মাধ্যমে সংজ্ঞায়িত করা হয়, যার মান প্রদত্ত উপাত্ত থেকে নির্ণয় করা হয়। অপরামিতিক নির্ভরণ বলতে ঐ পদ্ধতি বোঝায়, যা ফাংশনসমূহের একটি সুনির্দিষ্ট সেটের মধ্যে নির্ভরণ অপেক্ষককে থাকার অনুমতি দেয়, যেটি অসীম-মাত্রিকও হতে পারে।
নির্ভরণ বিশ্লেষণে ব্যবহৃত পদ্ধতিগুলোর কর্মক্ষমতা উপাত্ত-সৃষ্টি প্রক্রিয়ার রূপ, এবং তা কীভাবে নির্ভরণে ব্যবহৃত পদ্ধতিটির সাথে অন্বিত তার উপর নির্ভর করে। যেহেতু উপাত্ত-সৃষ্টি প্রক্রিয়ার প্রকৃত রূপ সাধারণত জানা থাকে না, নির্ভরণ বিশ্লেষণে অনেক সময় এই প্রক্রিয়া সম্বন্ধে অনুমিত স্বতঃসিদ্ধের ওপর কিছুটা নির্ভরশীল হতে হয়। এই স্বতঃসিদ্ধগুলো কখনও কখনও পরীক্ষণযোগ্য, যদি পর্যাপ্ত পরিমাণে উপাত্ত বিদ্যমান থাকে। পূর্বাভাসের জন্য নির্ভরণ প্রতিমানসমূহ অনেক সময়ই কার্যকরী, এমনকি যখন তা স্বতঃসিদ্ধগুলোকে পরিমিতভাবে লঙ্ঘন করে তখনও; যদিও তাদের কর্মক্ষমতা সন্তোষজনক না-ও হতে পারে। তা স্বত্বেও, অনেক ক্ষেত্রেই, বিশেষ করে পর্যবেক্ষণলব্ধ উপাত্তের ভিত্তিতে প্রভাব নগণ্য হলে বা কার্যকারণ-সম্পর্ক নিয়ে প্রশ্ন থাকলে, নির্ভরণ পদ্ধতি বিভ্রান্তিকর ফলাফল দিতে পারে।[2][3]
সংকীর্ণ দৃষ্টিতে দেখলে, নির্ভরণ সুনির্দিষ্টভাবে কোন অবিচ্ছিন্ন প্রতিক্রিয়া (অধীন) চলকসমূহের নির্ণয় প্রক্রিয়াকে বোঝাতে পারে, যা শ্রেণিবিন্যাস প্রক্রিয়ায় ব্যবহৃত বিচ্ছিন্ন প্রতিক্রিয়া চলক নির্ণয়ের বিপরীত।[4] অবিচ্ছিন্ন অধীন চলকের ক্ষেত্রে প্রক্রিয়াটিকে প্রাসঙ্গিক অন্যান্য সমস্যাগুলো থেকে আলাদা করার জন্য মেট্রিক নির্ভরণ নামে সুনির্দিষ্টভাবে অভিহিত করা যেতে পারে।[5]