সূচক নির্মাণে ডেটা মাইনিং:কেন বিনিয়োগকারীদের সতর্ক হতে হবে

ফাইন্যান্সের জগৎ এতটাই বিস্তৃত এবং সাধারণভাবে প্রচলিত একটি অসুস্থতায় আচ্ছন্ন যে এমনকি "বিশেষজ্ঞরাও" এটিকে প্রয়োজনীয় গুরুত্ব সহকারে নিচ্ছেন বলে মনে হয় না। যে অসুখটি শীঘ্রই প্রত্যাহারের কোন চিহ্ন দেখায় না সেটিকে ‘ডেটা মাইনিং’ বলা হয়। এটি কীভাবে সূচক নির্মাণকে প্রভাবিত করে এবং কেন আমাদের সতর্ক হওয়া দরকার তা এখানে রয়েছে। এটি আর্থিক বাজারের একজন বিশেষজ্ঞের একটি অতিথি পোস্ট যিনি ব্যক্তিগত কারণে বেনামী হতে চান৷

'টেক' ব্যাকগ্রাউন্ড থেকে আগত পাঠকদের বেশিরভাগেরই সবসময় ডেটা মাইনিং সম্পর্কে ইতিবাচক মতামত থাকে এবং ঠিক তাই কারণ, বিভিন্ন ক্ষেত্রে, ডেটা এবং ডেটা মাইনিং বিস্ময়কর কাজ করেছে - গ্রাহকদের আচরণ বোঝার মতো সহজ জিনিস থেকে শুরু করে আবহাওয়ার প্রবণতা বিশ্লেষণ করা পর্যন্ত বিক্রি বাড়ানোর জন্য পূর্বাভাস - ডেটা এবং ডেটা মাইনিং এত সহায়ক হয়েছে। যাইহোক, ফিনান্স এবং ইনভেস্টমেন্ট ম্যানেজমেন্টের প্রেক্ষাপটে - 'ডেটা মাইনিং' একটি প্লেগ।

ফাইন্যান্স/ইনভেস্টমেন্ট ম্যানেজমেন্টের প্রসঙ্গে, আমাকে ডেটা মাইনিং কী বলে সংজ্ঞায়িত করা যাক? ডেটা মাইনিং কোনো অর্থনৈতিক এবং স্বজ্ঞাত যুক্তি ছাড়া অতীতের ডেটা দেখা ছাড়া আর কিছু নয়, বিশেষ করে 'উচ্চতর' কর্মক্ষমতার নিদর্শনগুলি সন্ধান করা। কম্পিউটিং শক্তির বৃদ্ধি এবং ইন্ট্রাডে ডেটার বৃহৎ আকারের প্রাপ্যতার পরিপ্রেক্ষিতে, একজন অর্ধ-শালীন প্রোগ্রামারের পক্ষে সহজ স্ক্রিপ্ট লেখা খুব কঠিন কিছু নয় যাতে হাজার হাজার না হলেও লক্ষাধিক ব্যাকটেস্ট কিছু দুর্দান্ত ফলাফল নিয়ে আসে। যাইহোক, পেশাদার এবং বিনিয়োগকারী উভয়ই সুবিধাজনকভাবে বিনিয়োগের সবচেয়ে কেন্দ্রীয় নীতিটি ভুলে যান - "অতীত ভবিষ্যতের নির্দেশক নয়" যদিও এই বিবৃতিটি যারা মিউচুয়াল ফান্ডের একটি একক স্টক বা ইউনিট কিনেছেন তাদের প্রত্যেকের দ্বারা ছুড়ে দেওয়া হয়।


এখানে কর্মে ডেটা মাইনিং এর একটি দৃষ্টান্ত রয়েছে। MSCI, বিশ্বের বৃহত্তম সূচক প্রদানকারী- ট্রিলিয়ন ডলারের সাথে হয় তাদের সূচকগুলি ট্র্যাক করে বা তাদের সূচকগুলির বিপরীতে বেঞ্চমার্ক করে, তিনটি আলাদা 'মান' সূচক রয়েছে –  MSCI মান সূচক, MSCI মান ওজনযুক্ত সূচক, MSCI 'উন্নত' মান সূচক৷ যেকোন যৌক্তিক ব্যক্তি নিম্নলিখিত প্রশ্নগুলি জিজ্ঞাসা করবে:কেন একই প্রদানকারী থেকে তিনটি ভিন্ন মূল্য সূচক রয়েছে? আমি কোনটিতে বিনিয়োগ করব? তাদের মধ্যে পার্থক্য কি কি? কিভাবে একটি অন্য থেকে ভাল? MSCI মান পরিবারের সবচেয়ে বয়স্ক সদস্য 1997 সাল থেকে লাইভ রয়েছে, মূল্য-ভারিত সূচকটি ডিসেম্বর 2010 এ চালু করা হয়েছিল এবং এপ্রিল 2015 এ উন্নত মূল্য। অবশ্যই, নতুন চালু হওয়া সূচকগুলি ব্যাকটেস্টে পুরানো সূচকগুলিকে ছাড়িয়ে গেছে এবং এটিই "উন্নতি ”।

নিম্নলিখিত চিত্রটি বিস্তৃত বাজার সূচকের বিপরীতে তিনটি মূল্য সূচকের এনএভি অনুপাত প্লট করে। NAV অনুপাত, যারা জানেন না তাদের জন্য, শুধুমাত্র একটি সূচক NAV-এর অনুপাত অন্য সূচক NAV দ্বারা ভাগ করা হয়। অনুপাতের অর্থনৈতিক ব্যাখ্যা হল একটি দীর্ঘ-সংক্ষিপ্ত পোর্টফোলিওর কর্মক্ষমতা যেখানে আমরা লব সূচক/পোর্টফোলিওতে 'লং' এবং ডিনোমিনেটর সূচক/পোর্টফোলিওতে 'ছোট' করি। সুতরাং, যদি NAV অনুপাত বেড়ে যায়, লব সূচকটি হর সূচককে (এই ক্ষেত্রে বেঞ্চমার্ক) ছাড়িয়ে যায় এবং যখন এটি নিচে যায়, লব সূচকটি হরকে কম করে। আপনি দেখতে পাচ্ছেন যে সাম্প্রতিক সূচকগুলি বিশেষ করে ব্যাকটেস্টগুলিতে উল্লেখযোগ্য ব্যবধানে পুরানোগুলিকে ছাড়িয়ে গেছে। এছাড়াও, এটি দেখতে আকর্ষণীয় যে নতুন সূচকগুলি তার পূর্বসূরি সূচকগুলির দীর্ঘস্থায়ী খারাপ পারফরম্যান্সের পরে চালু হয়েছে। 2+3=5 একত্রিত করতে ফরেনসিক বিশ্লেষক এবং অনুসন্ধানী সাংবাদিকদের একটি দল লাগে না। একবার সূচকগুলি চালু হয়ে গেলে এবং তারা লাইভ হয়ে গেলে, তাদের কী হয়েছিল? এটা ডাটা মাইনিং এর ফল। ডেটা মাইনিং দ্বারা জর্জরিত অ-শক্তিশালী ব্যাকটেস্টগুলি শীঘ্র বা পরে তাদের আসল রঙ প্রকাশ করবে। আসল বিষয়টি হল একাডেমিক মান ফ্যাক্টরটি এক দশকেরও বেশি সময় ধরে কম পারফর্ম করছে। তথ্য মাইনিং কোন পরিমাণ যে সত্য পরিবর্তন করতে পারেন. আমরা মূল্যকে যেভাবেই দেখি না কেন, তা থেকে রেহাই নেই। যাইহোক, একটি চমত্কার অতীত কর্মক্ষমতা কি বিক্রি হয়. একজন লোককে খেতে হবে, আর খেতে হলে তাকে বিক্রি করতে হবে, তাই..!

NAV বিবর্তন টীকা সহ MSCI মান সূচকের

কেউ ভাবতে পারে কিভাবে আমরা এত নিশ্চিত যে ডেটা মাইনিং আছে? কেন আমরা তাদের সন্দেহের সুবিধা দিতে পারি না? ওয়েল, এটা তাদের পদ্ধতির নথিতে খোলা আছে. MSCI কিভাবে বিভিন্ন ভেরিয়েবল বেছে নেয় এবং এর ফ্যাক্টর গঠনের ক্ষেত্রে তাদের গুরুত্বের উপর নিচে একটি উদ্ধৃতি দেওয়া হল। তারা নির্দ্বিধায় স্বীকার করে যে তারা অতিরিক্ত ওজনের পরিবর্তনশীল যা ব্যাকটেস্টে ভাল রিটার্ন/অস্থিরতা দেখিয়েছে। এটি ডেটা মাইনিংয়ের পাঠ্যপুস্তকের সংজ্ঞা এবং তারা প্রকাশ্যে বলে – তারা ডেটা মাইনিং করে। এর অর্থ কেবল দুটি জিনিসের মধ্যে একটি হতে পারে - 1. তারা এমনকি জানে না যে তারা ডেটা মাইনিং করে। 2. তারা কেবল পাত্তা দেয় না। আমি জানি না যে দুটি কারণের মধ্যে কোনটি অন্যটির চেয়ে বেশি বিপজ্জনক৷

এটি MSCI FaCS মেথডলজি ডকুমেন্ট

-এর পৃষ্ঠা 8 থেকে একটি স্ক্রিনশট
এর থেকে স্ক্রিনশট MSCI FaCS পদ্ধতির নথির পৃষ্ঠা 8

স্পষ্টতার জন্য পাঠ্যটি নীচে পুনরুত্পাদন করা হয়েছে:

পাঠকরা জিজ্ঞাসা করবেন, এটি মার্কিন ডেটা, মার্কিন সূচক, মার্কিন সরবরাহকারী – আমি কেবল ভারতে মিউচুয়াল ফান্ডে বিনিয়োগ করছি কেন আমি যত্ন নেব? যদি সমস্যাটি সূচকে এটি স্পষ্টভাবে প্রচলিত হয়, যার পিছনের পরীক্ষার ট্র্যাক রেকর্ড, নির্মাণ পদ্ধতি, লঞ্চের তারিখ এবং লাইভ ট্র্যাক রেকর্ড সর্বজনীন, তাহলে আপনার প্রিয় সক্রিয় তহবিলের স্কেল এবং মাত্রা কল্পনা করুন যার জন্য আপনার কোনও অ্যাক্সেস নেই৷ শূন্য স্বচ্ছতা আছে। সূচকগুলি নিয়ম ভিত্তিক এবং পদ্ধতিগত যেখানে সক্রিয় মিউচুয়াল ফান্ডগুলি সম্পূর্ণ বিবেচনাধীন। মিউচুয়াল ফান্ড ইন্ডাস্ট্রিতে ডাটা মাইনিং যে পরিমাণে প্রচলিত হবে তা আমি সম্ভবত অনুমান করতে পারি না। ঈশ্বরকে ধন্যবাদ, SEBI প্রতিটি বিভাগে তহবিলের সংখ্যা সীমিত করার নিয়ম নিয়ে এসেছে।

এর অর্থ এই নয় যে আমরা কখনই কোনো কিছুর পরীক্ষায় পিছিয়ে পড়া বা পিছনের পরীক্ষার পারফরম্যান্সের দিকে তাকানো উচিত নয়। অবশ্যই না. আমাদের সিদ্ধান্ত নেওয়ার জন্য অতীতের ডেটাই একমাত্র তথ্য। আমরা এক চিমটি লবণ দিয়ে এটি গ্রহণ করা উচিত। পাট্টু স্যার বলেছেন, “চেরি বাছাই করা সেরা অতীতের রিটার্ন ভুল। চেরি বাছাই সবচেয়ে খারাপ অতীতের ঝুঁকি বিচক্ষণতা"। যে প্রায় কাছাকাছি এটা. ডেটা মাইনিং কী এবং কী নয় তার এক লাইনের সারাংশ। এইভাবে বিনিয়োগকারী হিসাবে আমাদের উচিত ব্যাকটেস্ট বা অতীতের ডেটার সাথে আচরণ করা - ঝুঁকি বোঝার জন্য। শিল্পের জন্য - কোন আশা নেই৷


সূচক তহবিল
  1. তহবিল তথ্য
  2. পাবলিক ইনভেস্টমেন্ট ফান্ড
  3. বেসরকারী বিনিয়োগ তহবিল
  4. হেজ ফান্ড
  5. বিনিয়োগ তহবিল
  6. সূচক তহবিল