নির্বাহী সারাংশ
<বিস্তারিত> <সারাংশ> রিগ্রেশন বিশ্লেষণ রিয়েল এস্টেট মূল্যায়নের জন্য আরও বৈজ্ঞানিক পদ্ধতির প্রস্তাব করেসারাংশ>রিয়েল এস্টেটে প্রায়ই, মূল্যায়নের প্রক্রিয়াটি বুড়ো আঙুল চোষার একটি উচ্চ-ভ্রু অনুশীলন হিসাবে আসতে পারে। রিয়েলটর আসবে, প্রবাদের টায়ারে লাথি মারবে এবং তারপর খুব কম "পরিমাণগত" অন্তর্দৃষ্টি সহ একটি আনুমানিক মান তৈরি করবে। সম্ভবত সম্পত্তির মালিকানা নিয়ে আসা মানসিক সংযুক্তি দ্বারা প্রক্রিয়াটি আরও বাড়িয়ে তোলে যে অনেকের জন্য একটি বাড়ি হবে জীবনের সবচেয়ে বড় আর্থিক বিনিয়োগ।
তবুও, এই পাগলামির একটি পদ্ধতি আছে। ওয়েল, সুনির্দিষ্ট হতে তিনটি।
তুলনামূলক বিক্রয় পদ্ধতি আবাসিক রিয়েল এস্টেটে সবচেয়ে সাধারণ এবং একটি বিষয় সম্পত্তির মান নির্ধারণ করতে অনুরূপ সম্পত্তির সাম্প্রতিক বিক্রয় ব্যবহার করে। "comps" এর বিক্রয় মূল্য তাদের এবং বিষয় সম্পত্তির মধ্যে পার্থক্যের উপর ভিত্তি করে সমন্বয় করা হয়। উদাহরণস্বরূপ, যদি একটি তুলনামূলক সম্পত্তিতে একটি অতিরিক্ত বাথরুম থাকে, তাহলে বাথরুমের আনুমানিক মূল্য তার পর্যবেক্ষণ করা বিক্রয় মূল্য থেকে বিয়োগ করা হয়।
বাণিজ্যিক রিয়েল এস্টেটকে আরও ভিন্নধর্মী হিসাবে বিবেচনা করা হয়, তাই তুলনামূলক বিক্রয় পদ্ধতি কম ঘন ঘন ব্যবহার করা হয়। আয়ের পদ্ধতি, এই ধারণার উপর ভিত্তি করে যে একটি সম্পদের অন্তর্নিহিত মূল্য তার সমস্ত ছাড়কৃত নগদ প্রবাহের যোগফলের সমতুল্য, সাধারণত দুটি পদ্ধতিতে প্রয়োগ করা হয়:
চূড়ান্ত কৌশল হল খরচ পদ্ধতি, যা একটি অভিন্ন জমি অর্জন এবং বিষয় সম্পত্তির একটি প্রতিরূপ নির্মাণের খরচের উপর ভিত্তি করে মূল্য অনুমান করে। তারপর বিষয় সম্পত্তির অপ্রচলিত বর্তমান অবস্থার উপর ভিত্তি করে প্রকল্পের খরচ অবমূল্যায়ন করা হয়। তুলনামূলক বিক্রয় পদ্ধতির সামঞ্জস্যের অনুরূপ, লক্ষ্য হল বিষয় সম্পত্তির সাথে ঘনিষ্ঠভাবে মেলানো। খরচ পদ্ধতি অন্য দুটি পদ্ধতির তুলনায় কম ঘন ঘন ব্যবহৃত হয়।
সমস্ত ঐতিহ্যবাহী রিয়েল এস্টেট মূল্যায়ন পদ্ধতি বিষয়ভিত্তিক, মূল্যায়নের জন্য ব্যবহৃত ইনপুট নির্বাচনের কারণে। উদাহরণস্বরূপ, ক্যাপ রেট পছন্দ একটি সম্পত্তি মূল্যায়নের উপর একটি উল্লেখযোগ্য প্রভাব ফেলে:যখন $1M এর NOI সহ একটি সম্পত্তির মূল্যায়ন করা হয় তখন ক্যাপ রেট 4% বৃদ্ধি (6% থেকে 10%) এর মান হ্রাস করবে সম্পত্তি 40% দ্বারা (নীচের চার্ট)।
রিয়েল এস্টেট মূল্যায়নের জন্য রিগ্রেশন মডেল ব্যবহার করার অনেক সুবিধা রয়েছে। খুচরা শিল্প সাইট নির্বাচনের জন্য এর ব্যবহার গ্রহণ করেছে, কিন্তু রিয়েল এস্টেট শিল্প, বেশিরভাগ অংশে, এর সম্ভাব্য সুবিধাগুলি উপেক্ষা করেছে। রিগ্রেশন বিশ্লেষণ বৃহৎ পরিমাণ ডেটা বিশ্লেষণের জন্য বিশেষভাবে উপযুক্ত। দেশের প্রতিটি স্থানীয় রিয়েল এস্টেট বাজার সম্পর্কে একটি শক্তিশালী জ্ঞান থাকা কার্যত অসম্ভব, কিন্তু রিগ্রেশন মডেলিং অনুসন্ধানকে সংকুচিত করতে সাহায্য করতে পারে৷
রিগ্রেশন মডেলিং ব্যবহার করার সবচেয়ে বড় সুবিধা হল এর অন্তর্নিহিত নমনীয়তা - তারা অন্য মডেল থেকে স্বাধীনভাবে বা তাদের সাথে কনসার্টে কাজ করতে পারে।
মডেলের আউটপুট হিসাবে একটি বিষয় সম্পত্তির মান ভবিষ্যদ্বাণী করতে বিদ্যমান বিক্রয় ডেটা ব্যবহার করা সবচেয়ে প্রত্যক্ষ পদ্ধতি। স্থানীয়, রাজ্য এবং ফেডারেল এজেন্সিগুলি থেকে বিনামূল্যে ডেটার অসংখ্য উত্স রয়েছে যা ব্যক্তিগত ডেটা প্রদানকারীদের সাথে পরিপূরক হতে পারে৷
আরেকটি বিকল্প হল অন্যান্য ঐতিহ্যগত মূল্যায়ন পদ্ধতির জন্য ইনপুটগুলি আরও সঠিকভাবে ভবিষ্যদ্বাণী করতে রিগ্রেশন মডেলগুলি ব্যবহার করা। উদাহরণস্বরূপ, একটি মিশ্র-ব্যবহারের বাণিজ্যিক প্রকল্প বিশ্লেষণ করার সময়, একজন বিকাশকারী খুচরা স্থানের জন্য প্রতি বর্গফুট বিক্রয়ের পূর্বাভাস দেওয়ার জন্য একটি মডেল তৈরি করতে পারে এবং আবাসিক উপাদানগুলির জন্য ভাড়ার হারের পূর্বাভাস দেওয়ার জন্য আরেকটি মডেল তৈরি করতে পারে৷ এই উভয়ই তারপর মূল্যায়নের জন্য একটি আয় পদ্ধতির ইনপুট হিসাবে ব্যবহার করা যেতে পারে।
শব্দ পরিসংখ্যান নীতিগুলি ব্যবহার করে মূল্যায়নের জন্য আরও উদ্দেশ্যমূলক পদ্ধতির ফলন করা হয়। নিশ্চিতকরণ পক্ষপাত এড়াতে এটি একটি সর্বোত্তম উপায়, যা তখন ঘটে যখন লোকেরা এমন তথ্য খোঁজে যা তাদের পূর্বে বিদ্যমান মতামতকে নিশ্চিত করে বা নতুন তথ্য প্রত্যাখ্যান করে যা এটির বিরোধী। যখন আমি খুচরা বিক্রেতাদের জন্য নতুন স্টোর বিক্রয়ের পূর্বাভাস দেওয়ার জন্য মডেল তৈরি করেছি, তখন তারা প্রায়শই এটা জেনে অবাক হয়েছিলেন যে অনেক খুচরা বিক্রেতা প্রতিযোগীর কাছাকাছি থেকে উপকৃত হন। আসলে, ওয়ালমার্টের সাথে কোলোকেশন, যারা প্রায়শই তাদের সবচেয়ে বড় প্রতিযোগী ছিল, আমার মডেলগুলিতে ব্যবহৃত সবচেয়ে সাধারণ ভেরিয়েবলগুলির মধ্যে একটি ছিল। বিদ্যমান পক্ষপাতের উপর নির্ভর করার ফলে সুযোগ হাতছাড়া হতে পারে, বা আরও খারাপ, বিপর্যয়গুলি ঠিক কোণায় লুকিয়ে রাখতে পারে।
পরিসংখ্যানগত মূল্যায়নের কিছু উদ্দেশ্যমূলক সুবিধা হল:
রিগ্রেশন মডেলগুলি অনন্য যে তাদের নির্ভুলতার জন্য একটি অন্তর্নির্মিত চেক রয়েছে। মোট জনসংখ্যার একটি নমুনার উপর একটি মডেল তৈরি করার পরে, আপনি সম্ভাব্য নমুনা পক্ষপাত সনাক্ত করতে নমুনার বাইরের ডেটাতে মডেলটি ব্যবহার করতে পারেন৷
ঐতিহ্যগত মূল্যায়ন পদ্ধতিতে নির্বাচনের পক্ষপাতের একটি উল্লেখযোগ্য ঝুঁকি রয়েছে। তুলনামূলক বৈশিষ্ট্যগুলি বেছে নেওয়ার সময়, সেরা ফলাফলগুলি বেছে নেওয়ার ফাঁদে পড়ে যাওয়া এবং ধরে নেওয়া খুব সহজ যে সেগুলি আপনার প্রকল্পের মতো। ভেরিয়েবলের ভবিষ্যদ্বাণী করার উপরও জোর দেওয়া হয়, যেমন আয় পদ্ধতিতে রিটার্নের হার। এই ভবিষ্যদ্বাণীর প্রয়োজনীয়তা দূর করা অনেক রিয়েল এস্টেট বিনিয়োগকারীদের কাছে আকর্ষণীয় হতে পারে, যে কারণে রিগ্রেশন-ভিত্তিক মূল্যায়ন একটি দরকারী পদ্ধতি৷
পরিসংখ্যানের বিভিন্ন শতাংশের উদ্ধৃতি দিয়ে যে পরিমাণ রসিকতা তৈরি করা হয়েছে তা আসলেই একটি রসিকতা। আমরা প্রায় প্রতিদিন একটি নতুন গবেষণা গবেষণার ফলাফল সম্পর্কে মিডিয়া শিরোনাম নিয়ে বোমাবর্ষণ করি, যার মধ্যে অনেকগুলি গত বছর প্রকাশিত একটি গবেষণার বিপরীত বলে মনে হয়। সাউন্ডবাইটের জগতে, গবেষকদের দ্বারা নিযুক্ত পদ্ধতির কঠোরতা নিয়ে আলোচনা করার সময় নেই৷
অনেক ধরনের রিগ্রেশন বিশ্লেষণ আছে, কিন্তু সবচেয়ে সাধারণ হল লিনিয়ার রিগ্রেশন। রৈখিক রিগ্রেশন সম্পর্কে কিছু অনুমান রয়েছে যা মডেলটিকে বৈধ বিবেচনা করার জন্য লঙ্ঘন করা উচিত নয়। এই অনুমানগুলি লঙ্ঘন করা পরিসংখ্যানগত পরীক্ষাগুলিকে বিকৃত করে যা ইনপুটগুলির ভবিষ্যদ্বাণীমূলক শক্তি এবং সামগ্রিক মডেলের গণনা করে৷
ইনপুট (স্বাধীন ভেরিয়েবল) এবং আউটপুট (নির্ভরশীল পরিবর্তনশীল) মধ্যে একটি রৈখিক সম্পর্ক থাকা উচিত। উদাহরণস্বরূপ, আমরা অনুমান করতে পারি যে একটি বাড়িতে উত্তপ্ত বর্গফুট এবং এর সামগ্রিক মূল্যের মধ্যে একটি রৈখিক সম্পর্ক রয়েছে। যাইহোক, হ্রাসপ্রাপ্ত রিটার্নের কারণে, আমরা আবিষ্কার করতে পারি যে সম্পর্কটি অ-রৈখিক, কাঁচা ডেটার একটি রূপান্তর প্রয়োজন৷
স্বাধীন ভেরিয়েবলগুলি এলোমেলো হওয়া উচিত নয়। সহজ করে বললে, মডেলের প্রতিটি স্বাধীন ভেরিয়েবলের জন্য পর্যবেক্ষণগুলি স্থির করা হয়েছে এবং তাদের পরিমাপে কোনও ত্রুটি নেই বলে ধরে নেওয়া হয়েছে। উদাহরণস্বরূপ, যদি আমরা একটি অ্যাপার্টমেন্ট বিল্ডিংয়ের মান মডেল করার জন্য ইউনিটের সংখ্যা ব্যবহার করি, তাহলে আমাদের নমুনা ডেটাতে থাকা সমস্ত বিল্ডিংয়ের একটি নির্দিষ্ট সংখ্যক ইউনিট থাকবে যা পরিবর্তন হবে না, আমরা যেভাবে মডেল তৈরি করি না কেন।
মডেলের "অবশিষ্ট" (অর্থাৎ মডেলের ভবিষ্যদ্বাণী করা ফলাফল এবং প্রকৃত পর্যবেক্ষণের মধ্যে পার্থক্য) যোগফল হবে 0, বা সহজ ভাষায়:আমরা যে মডেলটি ব্যবহার করব তা সেরা ফিট লাইনের প্রতিনিধিত্ব করবে৷
মডেলটি প্রতিটি স্বাধীন পরিবর্তনশীলের জন্য সমস্ত পর্যবেক্ষণের জন্য সঠিক হওয়া উচিত। যদি আমরা একটি বাড়ির বর্গাকার ফুটেজের উপর ভিত্তি করে তার মূল্য ভবিষ্যদ্বাণী করি, তাহলে আমরা মডেলটি ব্যবহার করতে চাই না যদি এটি 1,500 বর্গফুটের নিচের বাড়ির জন্য মূল্য ভবিষ্যদ্বাণী করার ক্ষেত্রে অত্যন্ত সঠিক হয়, তবে 3,000-এর বেশি বাড়ির জন্য একটি বড় পরিমাণ ত্রুটি ছিল। বর্গফুট. এটি হেটেরোসেডেস্টিসিটি নামে পরিচিত।
রিয়েল এস্টেট শিল্পের দিকে তাকালে রৈখিক রিগ্রেশনের সাথে সবচেয়ে সাধারণ সমস্যাগুলির মধ্যে একটি হল পর্যবেক্ষণের মধ্যে অবশিষ্ট ত্রুটিগুলির একটি সম্পর্ক। আপনি এটিকে সাদা গোলমাল হিসাবে ভাবতে পারেন যার কোনও প্যাটার্ন নেই। যাইহোক, যদি অবশিষ্টাংশগুলির একটি প্যাটার্ন থাকে, তাহলে সম্ভবত আমাদের একটি সমন্বয় করতে হবে। এই সমস্যাটি ধারণা করা কঠিন, তবে দুটি প্রধান ক্ষেত্র রয়েছে যেখানে এটি রিয়েল এস্টেট শিল্পে উদ্বেগের বিষয়৷
দীর্ঘ সময় ধরে পর্যবেক্ষণের উপর ভিত্তি করে একটি মডেল তৈরি করা বর্তমান মান ভবিষ্যদ্বাণী করার জন্য অনুপযুক্ত হবে। ধরুন আমরা একটি স্বাধীন পরিবর্তনশীল হিসাবে গড় রুমের হার ব্যবহার করে একটি হোটেল সম্পত্তির মূল্য ভবিষ্যদ্বাণী করার জন্য একটি মডেল তৈরি করেছি। এই ভেরিয়েবলের ভবিষ্যদ্বাণী করার ক্ষমতা বিভ্রান্তিকর হতে পারে কারণ সময়ের সাথে সাথে রুমের রেট ধারাবাহিকভাবে বেড়েছে। পরিসংখ্যানগত পরিভাষায়, পর্যবেক্ষিত গড় রুমের হারের মধ্যে একটি স্বতঃসম্পর্ক রয়েছে যা সময়ের সাথে সাথে একটি ইতিবাচক প্রবণতা দেখায় (অর্থাৎ মুদ্রাস্ফীতি) যা মডেলটিতে গণনা করা হবে না। আবাসিক রিয়েল এস্টেটে সর্বাধিক ব্যবহৃত ঐতিহ্যগত তুলনামূলক বিক্রয় পদ্ধতি শুধুমাত্র সাম্প্রতিক ডেটা ব্যবহার করে এই সমস্যাটি দূর করে। যেহেতু বাণিজ্যিক লেনদেনের সংখ্যা অনেক কম, এই সময়ের সীমাবদ্ধতা প্রায়শই তুলনামূলক বিক্রয় পদ্ধতিকে অকার্যকর করে তোলে। যাইহোক, রৈখিক রিগ্রেশন ব্যবহার করে এমন কৌশল রয়েছে যা স্বতঃসম্পর্কের সমস্যাগুলি কাটিয়ে উঠতে পারে৷
ক্লাস্টার প্রভাব রিয়েল এস্টেট মূল্যায়ন মডেলিং একটি উল্লেখযোগ্য চ্যালেঞ্জ. এটি স্থানিক স্বয়ংক্রিয় সম্পর্ক হিসাবে চিন্তা করা যেতে পারে। এই সমস্যাটি চিন্তা করার সবচেয়ে সহজ উপায় হল একটি হাইওয়ের উভয় পাশে দুটি পাড়ায় (A এবং B) বাড়ির মূল্য অনুমান করার জন্য একটি মডেল নির্মাণের কল্পনা করা। সামগ্রিকভাবে, মডেলটি মান ভবিষ্যদ্বাণীতে ভাল কাজ করতে পারে, কিন্তু যখন আমরা অবশিষ্ট ত্রুটিগুলি পরীক্ষা করি তখন আমরা লক্ষ্য করি যে একটি প্যাটার্ন আছে। আশেপাশের A-এর বাড়িগুলি সাধারণত প্রায় 10% অতিমূল্যায়িত হয়, এবং আশেপাশের B-এর বাড়িগুলি প্রায় 10% অবমূল্যায়িত হয়। আমাদের মডেল উন্নত করতে, আমাদের এই ক্লাস্টার প্রভাবের জন্য হিসাব করতে হবে বা প্রতিটি আশেপাশের জন্য একটি মডেল তৈরি করতে হবে৷
আদর্শভাবে, একটি মডেলের মধ্যে ভেরিয়েবল একে অপরের সাথে সম্পর্কযুক্ত হবে না। পরিচিত এই সমস্যাটিকে মাল্টিকোলিনিয়ারিটি বলা হয়। আঞ্চলিক মলের মূল্যায়নকারী মডেলের ইনপুট হিসাবে বর্গফুট এবং পার্কিং স্পটগুলির সংখ্যা উভয়ই ব্যবহার করা সম্ভবত বহুসংখ্যা প্রদর্শন করবে। এটি স্বজ্ঞাত কারণ পরিকল্পনা কোডগুলির জন্য প্রায়ই একটি বাণিজ্যিক স্থানের বর্গ ফুটেজের উপর ভিত্তি করে নির্দিষ্ট সংখ্যক পার্কিং স্পট প্রয়োজন। এই উদাহরণে, ভেরিয়েবলগুলির একটিকে সরিয়ে দিলে তা উল্লেখযোগ্যভাবে ভবিষ্যদ্বাণী করার ক্ষমতা হ্রাস না করে সামঞ্জস্য করা মডেলের আরও সঠিক মূল্যায়ন করবে৷
পর্যবেক্ষিত ডেটা ব্যবহার করা যে কোনও অভিজ্ঞতামূলক পদ্ধতির মূল, তবে এটি মনে রাখা গুরুত্বপূর্ণ যে অতীতের ফলাফলগুলি সর্বদা ভবিষ্যতের পূর্বাভাস দেয় না। রিয়েল এস্টেটের মতো ইলিকুইড সম্পদগুলি ব্যবসা চক্রের পরিবর্তনের জন্য বিশেষভাবে ঝুঁকিপূর্ণ। বর্তমান অর্থনৈতিক অবস্থার উপর ভিত্তি করে নির্দিষ্ট ভেরিয়েবলের ভবিষ্যদ্বাণী করার ক্ষমতা পরিবর্তিত হতে পারে। এই সমস্যাটি রৈখিক রিগ্রেশনের জন্য অনন্য নয় এবং ঐতিহ্যগত পদ্ধতির সাথেও পাওয়া যায়।
পারস্পরিক সম্পর্ক সমান কার্যকারণ নয়। মডেল বিল্ডিংয়ের উদ্দেশ্য হল কার্যকর ভেরিয়েবলগুলি খুঁজে বের করা যা বৈধ ভবিষ্যদ্বাণী করবে। আপনাকে অবশ্যই বানোয়াট পারস্পরিক সম্পর্ক থেকে সতর্ক থাকতে হবে। আপনি জেনে অবাক হতে পারেন যে মেইনে বিবাহবিচ্ছেদের হার এবং মাথাপিছু মার্জারিন ব্যবহারের মধ্যে একটি অত্যন্ত শক্তিশালী সম্পর্ক রয়েছে। যাইহোক, আপনি যদি ভবিষ্যতে মার্জারিন বিক্রির ভবিষ্যদ্বাণী করার চেষ্টা করেন তবে মেইন থেকে বিবাহবিচ্ছেদের ডেটা ব্যবহার করার অর্থ হবে না৷
আসুন এখন এই জ্ঞানটি ব্যবহারিকভাবে প্রয়োগ করি এবং শুরু থেকে শেষ পর্যন্ত একটি লিনিয়ার মডেল তৈরি করি। আমাদের উদাহরণের জন্য, আমরা একটি রিয়েল এস্টেট মূল্যায়ন মডেল তৈরি করার চেষ্টা করব যা অ্যালেগনি কাউন্টি, পেনসিলভেনিয়ায় একক-পরিবার বিচ্ছিন্ন বাড়ির মূল্যের পূর্বাভাস দেয়। Alleghany কাউন্টির পছন্দ নির্বিচারে, এবং প্রদর্শিত অধ্যক্ষ যে কোনো অবস্থানের জন্য কাজ করবে। আমরা এক্সেল এবং SPSS ব্যবহার করব, যা একটি সাধারণ পরিসংখ্যানগত সফ্টওয়্যার৷
৷মানসম্পন্ন ডেটা খোঁজা হল একটি সঠিক মডেল তৈরির প্রথম ধাপ এবং সম্ভবত সবচেয়ে গুরুত্বপূর্ণ। যদিও আমরা সবাই "আবর্জনা ভিতরে, আবর্জনা আউট" শব্দটি শুনেছি, এটি মনে রাখা গুরুত্বপূর্ণ যে কোনও নিখুঁত ডেটাসেট নেই। যতক্ষণ না আমরা স্বাচ্ছন্দ্যে অনুমান করতে পারি যে নমুনা ডেটা সমগ্র জনসংখ্যার প্রতিনিধি তা ততক্ষণ পর্যন্ত এটি ঠিক। রিয়েল এস্টেট ডেটার তিনটি প্রধান উৎস রয়েছে:
আমরা আমাদের উদাহরণের জন্য একচেটিয়াভাবে বিনামূল্যে ডেটা ব্যবহার করব, যা ওয়েস্টার্ন পেনসিলভানিয়া আঞ্চলিক ডেটা সেন্টার এবং মার্কিন আদমশুমারি ব্যুরো থেকে প্রাপ্ত। Alleghany রিয়েল এস্টেট বিক্রয় ডেটা আমাদের নির্ভরশীল পরিবর্তনশীল (Y পরিবর্তনশীল) হিসাবে বিক্রয় মূল্য সহ আমাদের পর্যবেক্ষণের জন্য একটি বেস ফাইল দেবে। আমরা প্রতিটি আদমশুমারির ট্র্যাক্ট এবং ট্যাক্স মূল্যায়ন তথ্যের জন্য হাঁটার স্কোর ব্যবহার করে ভেরিয়েবল পরীক্ষা করব৷
রিয়েল এস্টেট মডেল তৈরি করার সময় একটি খুব দরকারী পরিবর্তনশীল হল প্রতিটি ঠিকানার অক্ষাংশ এবং দ্রাঘিমাংশ। আপনি একটি জিওকোডারের মাধ্যমে এই ডেটা পেতে পারেন যা একটি অক্ষাংশ এবং দ্রাঘিমাংশ নির্ধারণ করতে একটি রাস্তার ঠিকানা ব্যবহার করে। ইউ.এস. সেন্সাস ব্যুরো জিওকোডার প্রতিটি অবস্থানের জন্য আদমশুমারির ট্র্যাক্ট সনাক্ত করবে যা সাধারণত জনসংখ্যাগত এবং সাইকোগ্রাফিক তথ্য একত্রিত করতে ব্যবহৃত হয়৷
এখন যেহেতু আমরা আমাদের ডেটা উত্সগুলি নির্বাচন করেছি, আমাদের ডেটার গুণমান পরীক্ষা করতে হবে৷ ডেটা গুণমান পরীক্ষা করার সবচেয়ে সহজ উপায় হল কয়েকটি মূল ভেরিয়েবলের জন্য একটি ফ্রিকোয়েন্সি টেবিল চালানো। যদি উল্লেখযোগ্য সংখ্যক অনুপস্থিত বা দূষিত এন্ট্রি থাকে তবে আমাদের আরও ডেটা পরীক্ষা করতে হবে। নীচের সারণীটি দেখায় যে 216,498টি রেকর্ডের মধ্যে শুধুমাত্র 1টির বিক্রয় ফাইলে একটি অনুপস্থিত জিপ কোড রয়েছে এবং 99999 বা 1X#45 এর মতো কোনও ভুল জিপ কোড নেই৷ এটি সম্ভবত নির্দেশ করে যে এটি একটি উচ্চ-মানের ডেটাসেট।
একটি ডেটা অভিধান যখন উপলব্ধ হয় তখন একটি চমৎকার সম্পদ। এটি প্রতিটি ভেরিয়েবল কী পরিমাপ করছে তার একটি বিবরণ দেবে এবং ভেরিয়েবলের সম্ভাব্য বিকল্পগুলি দেবে৷ আমাদের ডেটাতে কাউন্টিতে সম্পাদিত প্রতিটি বিক্রয়ের একটি বিশ্লেষণ রয়েছে। এটি মূল তথ্য, বিশেষ করে যখন কাঁচা দলিল রেকর্ডের সাথে কাজ করে। সমস্ত রিয়েল এস্টেট লেনদেন অবশ্যই আইন দ্বারা প্রয়োগযোগ্য হওয়ার জন্য রেকর্ড করা আবশ্যক, কিন্তু সমস্ত স্থানান্তর একটি সম্পত্তির প্রকৃত ন্যায্য বাজার মূল্য প্রতিফলিত করে না। উদাহরণ স্বরূপ, দুই পরিবারের সদস্যদের মধ্যে একটি বিক্রয় উপহারের একটি ফর্ম হিসাবে বা দলিল স্ট্যাম্পের মতো উচ্চতর লেনদেনের খরচ এড়াতে বাজার মূল্যের নীচে হতে পারে। সৌভাগ্যবশত আমাদের জন্য, স্থানীয় সরকার স্পষ্টভাবে স্থানান্তরগুলি চিহ্নিত করে যা তারা বিশ্বাস করে যে তারা বর্তমান বাজার মূল্যের প্রতিনিধি নয়, তাই আমরা শুধুমাত্র একটি "বৈধ বিক্রয়" প্রতিফলিত রেকর্ড ব্যবহার করব। এই বিক্রয়গুলি মোট লেনদেনের সংখ্যার মাত্র 18% এর জন্য দায়ী, এটি ব্যাখ্যা করে যে বিশ্লেষণের জন্য এটি ব্যবহার শুরু করার আগে আপনার ডেটা বোঝা কতটা গুরুত্বপূর্ণ। আমার অভিজ্ঞতার ভিত্তিতে দলিলের রেকর্ড বিশ্লেষণ করার সময় এই অনুপাতটি বেশ সাধারণ। এটা খুবই সম্ভব যে আমরা যদি "অবৈধ বিক্রয়" সহ একটি মডেল তৈরি করি তাহলে আমাদের চূড়ান্ত ফলাফলগুলি বিকৃত হবে৷
এর পরে, আমরা বিক্রয় ফাইলে আমাদের মূল্যায়ন ডেটা এবং ওয়াক স্কোর যুক্ত করব। এটি আমাদের মডেলের জন্য ব্যবহার করার জন্য আমাদের একটি একক টেবিল দেয়। এই মুহুর্তে, আমাদের ভেরিয়েবলগুলিকে বিশ্লেষণ করতে হবে যে তারা লিনিয়ার রিগ্রেশনের জন্য উপযুক্ত কিনা। নীচে বিভিন্ন ধরনের ভেরিয়েবল দেখানো একটি টেবিল।
আমাদের ফাইলে আশেপাশের বা পিন কোডের মতো বেশ কিছু নামমাত্র মান রয়েছে, যা কোনও ক্রমানুসারে ডেটা শ্রেণীবদ্ধ করে। নামমাত্র মান রূপান্তর ছাড়া লিনিয়ার রিগ্রেশনের জন্য অনুপযুক্ত। এছাড়াও বেশ কিছু অর্ডিনাল ভেরিয়েবল রয়েছে যা নির্মাণের গুণমান, সম্পত্তির বর্তমান অবস্থা ইত্যাদিকে গ্রেড করে৷ অর্ডিনাল ডেটার ব্যবহার তখনই উপযুক্ত যখন আমরা যুক্তিসঙ্গতভাবে ধরে নিতে পারি যে প্রতিটি র্যাঙ্ক সমানভাবে ব্যবধানে রয়েছে৷ উদাহরণস্বরূপ, আমাদের ডেটাতে 19টি ভিন্ন শ্রেণিবিন্যাস (A+, A, A-, ইত্যাদি) সহ একটি গ্রেড পরিবর্তনশীল রয়েছে, তাই আমরা নিরাপদে অনুমান করতে পারি যে এই গ্রেডগুলি সম্ভবত সমানভাবে ব্যবধানে রয়েছে৷
এছাড়াও বেশ কয়েকটি ভেরিয়েবল রয়েছে যেগুলিকে আমরা মডেলে ব্যবহার করার আগে রূপান্তরিত করতে হবে। একটি নামমাত্র মান যা পরীক্ষার জন্য একটি ডামি ভেরিয়েবলে রূপান্তরিত হতে পারে তা হল হিটিং এবং কুলিং ভেরিয়েবল। আমরা এয়ার কন্ডিশনার ছাড়া সমস্ত বৈশিষ্ট্যের জন্য 0 তে ভেরিয়েবল সেট করব এবং যাদের এয়ার কন্ডিশনার আছে তাদের জন্য 1 এ। এছাড়াও, অক্ষর গ্রেডগুলিকে সংখ্যায় রূপান্তর করতে হবে (যেমন 0 =সবচেয়ে খারাপ, 1=ভালো, 2=সেরা) দেখতে। যদি দামের সাথে একটি রৈখিক সম্পর্ক থাকে।
অবশেষে, সমস্ত পর্যবেক্ষণ ব্যবহার করা উপযুক্ত কিনা তা আমাদের নির্ধারণ করতে হবে। আমরা একক-পরিবার বিচ্ছিন্ন বাড়ির মানগুলির ভবিষ্যদ্বাণী করতে চাই, যাতে আমরা ডেটা থেকে সমস্ত বাণিজ্যিক সম্পত্তি, কনডো এবং টাউনহোমগুলি মুছে ফেলতে পারি। আমরা স্বয়ংক্রিয় সম্পর্কের সাথে সম্ভাব্য সমস্যাগুলি এড়াতেও চাই, তাই এটি ঘটার সম্ভাবনা সীমিত করতে আমরা শুধুমাত্র 2017 সালে বিক্রয়ের জন্য ডেটা ব্যবহার করি। আমরা সমস্ত বহিরাগত রেকর্ডগুলি মুছে ফেলার পরে, আমাদের চূড়ান্ত ডেটা পরীক্ষা করার জন্য সেট আছে৷
সঠিক নমুনার আকার নির্বাচন করা কঠিন হতে পারে। একাডেমিক উপকরণগুলির মধ্যে, প্রস্তাবিত ন্যূনতম সংখ্যার বিস্তৃত পরিসর এবং অঙ্গুষ্ঠের বিভিন্ন নিয়ম রয়েছে। আমাদের অধ্যয়নের জন্য, সামগ্রিক জনসংখ্যা বেশ বড়, তাই নমুনার জন্য পর্যাপ্ত থাকার বিষয়ে আমাদের চিন্তা করার দরকার নেই। পরিবর্তে, আমরা একটি নমুনা এত বড় হওয়ার ঝুঁকি চালাই যে মডেলটিতে প্রায় প্রতিটি ভেরিয়েবলের একটি পরিসংখ্যানগত তাৎপর্য থাকবে। শেষ পর্যন্ত, প্রায় 10% রেকর্ড এলোমেলোভাবে মডেলিংয়ের জন্য নির্বাচিত হয়েছিল।
পরিসংখ্যানগত সফ্টওয়্যার ছাড়া পরিবর্তনশীল নির্বাচন প্রক্রিয়ার সবচেয়ে কঠিন অংশগুলির মধ্যে একটি হতে পারে। যাইহোক, SPSS আমাদেরকে রৈখিক রিগ্রেশনের জন্য উপযুক্ত বলে মনে করা ভেরিয়েবলের সংমিশ্রণ থেকে দ্রুত অনেক মডেল তৈরি করতে দেয়। SPSS স্বয়ংক্রিয়ভাবে পরিসংখ্যানগত তাত্পর্যের জন্য আমাদের থ্রেশহোল্ডের উপর ভিত্তি করে ভেরিয়েবলগুলিকে ফিল্টার করবে এবং শুধুমাত্র সেরা মডেলগুলি ফিরিয়ে দেবে৷
আমাদের নমুনা ডেটা থেকে, SPSS পাঁচটি মডেল তৈরি করেছে। যে মডেলটি সবচেয়ে বেশি ভবিষ্যদ্বাণীমূলক ছিল তাতে নিম্নলিখিত 5টি ভেরিয়েবল অন্তর্ভুক্ত ছিল৷
৷আসুন SPSS এর ফলাফলগুলি দেখে নেই। আমাদের প্রধান ফোকাস প্রাথমিকভাবে R-স্কোয়ার মানের উপর থাকবে যা আমাদেরকে বলে যে নির্ভরশীল পরিবর্তনশীল (মূল্য) এর কত শতাংশ পরিবর্তনের মাধ্যমে রিগ্রেশনের পূর্বাভাস দেওয়া হয়েছে। সর্বোত্তম সম্ভাব্য মান হবে 1, এবং আমাদের মডেলের ফলাফল বেশ আশাব্যঞ্জক। মডেলের নির্ভুলতা পরিমাপ করে এমন অনুমানের স্ট্যান্ডার্ড ত্রুটি $73,091-এ বেশ বেশি বলে মনে হচ্ছে। যাইহোক, যদি আমরা মডেলের বিক্রয় মূল্যের মান বিচ্যুতির সাথে তুলনা করি ($160,429), ত্রুটিটি যুক্তিসঙ্গত বলে মনে হয়।
মডেল 5-এর একটি গ্রহণযোগ্য মান ত্রুটি ছিল এবং ডারবিন-ওয়াটসন পরীক্ষায় উত্তীর্ণ হয়েছে
Durbin-Watson টেস্ট ব্যবহার করে স্বতঃসম্পর্ক পরীক্ষা করার জন্য SPSS-এর অন্তর্নির্মিত কার্যকারিতা রয়েছে। আদর্শভাবে, 0 থেকে 4 এর স্কেলে মানটি 2.0 হবে, কিন্তু 1.652 এর মান অ্যালার্ম সৃষ্টি করবে না।
এর পরে, আমরা মডেলের ফলাফলগুলি পরীক্ষা করি যে হেটেরোসেডেস্টিসিটির কোনও প্রমাণ আছে কিনা তা নির্ধারণ করতে। SPSS-এর জন্য কোনও অন্তর্নির্মিত কার্যকারিতা নেই, তবে আহমদ দারিয়ানটোর লেখা এই ম্যাক্রোটি ব্যবহার করে আমরা ব্রুশ-প্যাগান এবং কোয়েনকার পরীক্ষাগুলি ব্যবহার করতে পারি। এই পরীক্ষাগুলি দেখায় যে আমাদের মডেলে ভিন্ন ভিন্নতা রয়েছে যেহেতু নীচের চার্টে তাত্পর্য স্তর (সিগ) .005 এর নীচে। আমাদের মডেল রৈখিক রিগ্রেশনের ক্লাসিক্যাল অনুমানের একটি লঙ্ঘন করেছে। সম্ভবত সমস্যাটি দূর করার জন্য মডেলের একটি ভেরিয়েবলকে পরিবর্তন করতে হবে। যাইহোক, আমরা এটি করার আগে আমাদের স্বাধীন ভেরিয়েবলের ভবিষ্যদ্বাণী করার ক্ষমতার উপর ভিন্ন ভিন্ন ভিন্নতার প্রভাবগুলি কী তা দেখতে একটি ভাল ধারণা। অ্যান্ড্রু এফ. হেইস দ্বারা তৈরি একটি ম্যাক্রো ব্যবহারের মাধ্যমে, আমরা আমাদের স্বাধীন ভেরিয়েবলগুলির জন্য সামঞ্জস্যপূর্ণ মান ত্রুটি এবং তাত্পর্যের স্তরগুলি দেখতে পারি৷
মডেলটিতে ভিন্ন ভিন্নতা রয়েছে, তবে আরও পরীক্ষাগুলি দেখায় যে এটি স্বাধীন ভেরিয়েবলকে প্রভাবিত করে না
আরও পরীক্ষা প্রকাশ করে যে স্বাধীন ভেরিয়েবলগুলি পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ থেকে যায়, মডেলে ভিন্ন ভিন্নতার জন্য হিসাব করার পরে, তাই আমাদের এখনই এটিকে পরিবর্তন করতে হবে না।
একটি চূড়ান্ত পরীক্ষা হিসাবে, আমরা আমাদের মডেলের সাথে আসল নমুনার অংশ নয় এমন সমস্ত বিক্রয় রেকর্ড করব। এটি আমাদের দেখতে সাহায্য করবে কিভাবে মডেলটি ডেটার একটি বৃহত্তর সেটে পারফর্ম করে। এই পরীক্ষার ফলাফলগুলি দেখায় যে বড় ডেটা সেটে অনুমানের R-স্কোয়ার মান এবং মানক ত্রুটি উল্লেখযোগ্যভাবে পরিবর্তিত হয়নি, যা সম্ভবত ইঙ্গিত দেয় যে আমাদের মডেল প্রত্যাশা অনুযায়ী কাজ করবে৷
সম্পূর্ণ ডেটাসেটে মডেলটি প্রয়োগ করলে নমুনার সাথে সামঞ্জস্যতা দেখা যায়, একই রকম R-স্কোয়ার এবং স্ট্যান্ডার্ড ত্রুটির মান পরিলক্ষিত হয়
আমরা যদি বাস্তব জীবনে আমাদের উদাহরণ মডেল ব্যবহার করতে চাই, তাহলে আমরা সম্ভবত আরও সুনির্দিষ্ট মডেলের জন্য ডেটাকে আরও বিভক্ত করব বা এই একক মডেলের নির্ভুলতা বাড়ানোর জন্য অতিরিক্ত ডেটা খুঁজব। এই পদক্ষেপগুলি সম্ভবত মডেলটিতে আমরা যে ভিন্ন ভিন্নতা দেখেছি তা সরিয়ে ফেলবে। এই সত্যের উপর ভিত্তি করে যে আমরা 1 মিলিয়নেরও বেশি লোকের সাথে একটি কাউন্টিতে বাড়ির মূল্য ভবিষ্যদ্বাণী করার জন্য একটি একক মডেল ব্যবহার করার চেষ্টা করছিলাম, এতে অবাক হওয়ার কিছু নেই যে আমরা মাত্র কয়েক ঘন্টার মধ্যে "নিখুঁত" মডেলটি তৈরি করতে পারিনি। .
আমাদের লক্ষ্য ছিল একটি মডেল তৈরি করা যা একক-পরিবার বিচ্ছিন্ন বাড়ির মূল্যের পূর্বাভাস দেয়। আমাদের বিশ্লেষণ দেখায় যে আমরা যুক্তিসঙ্গত পরিমাণ নির্ভুলতার সাথে সেই লক্ষ্যটি সম্পন্ন করেছি, কিন্তু আমাদের মডেলটি কি অর্থপূর্ণ?
আমরা যদি আমাদের মডেল বর্ণনা করি, আমরা বলব যে একটি বাড়ির মূল্য লটের আকার, বাড়ির বর্গ ফুটেজ, নির্মাণের গুণমান, মেরামতের বর্তমান অবস্থা এবং এটি আছে কি না তার উপর নির্ভর করে। এয়ার কন্ডিশনার এটি খুব যুক্তিসঙ্গত বলে মনে হচ্ছে। প্রকৃতপক্ষে, যদি আমরা আমাদের মডেলটিকে ঐতিহ্যগত মূল্যায়ন পদ্ধতির সাথে তুলনা করি, আমরা দেখতে পাই যে এটি ব্যয় পদ্ধতির সাথে খুব মিল, যা বর্তমান অপ্রচলিত অবস্থার জন্য সামঞ্জস্যপূর্ণ জমি অধিগ্রহণ এবং একটি নতুন ভবন নির্মাণের খরচ যোগ করে। যাইহোক, এই মিল হতে পারে, একটি রিগ্রেশন শব্দগুচ্ছ ব্যবহার করার জন্য, একটি বানোয়াট পারস্পরিক সম্পর্ক।
সাধারণত খরচ পদ্ধতি শুধু পুরানো সম্পত্তির অবমূল্যায়নের জন্য উপযুক্ত পদ্ধতি নির্ধারণে সমস্যার কারণে নতুন বৈশিষ্ট্যের মূল্যায়নের জন্য সুপারিশ করা হয়েছে। আমাদের মডেলের সাথে, আমরা একটি অনুরূপ কৌশল তৈরি করেছি যা যেকোনো বয়সের বৈশিষ্ট্যের জন্য উপযোগী, প্রকৃতপক্ষে, আমরা একটি স্বাধীন পরিবর্তনশীল হিসাবে বয়স পরীক্ষা করেছি এবং এই সিদ্ধান্তে পৌঁছেছি যে বৈশিষ্ট্যের মানগুলিতে এর কোনো পরিসংখ্যানগতভাবে উল্লেখযোগ্য প্রভাব নেই!
আশা করি, এখন পর্যন্ত, আপনি রিগ্রেশন বিশ্লেষণের মূল বিষয়গুলি সম্পর্কে আরও ভালভাবে বুঝতে পেরেছেন। পরবর্তী প্রশ্ন হল:এটা কি আপনার ব্যবসায় সাহায্য করতে পারে? আপনি যদি এই প্রশ্নের যেকোনও হ্যাঁ উত্তর দেন, তাহলে আপনি সম্ভবত রিগ্রেশন বিশ্লেষণকে একটি টুল হিসেবে ব্যবহার করে উপকৃত হতে পারেন।
উপরের উদাহরণ মডেলটি রিয়েল এস্টেটে রিগ্রেশন মডেলিং ব্যবহারের মূল্যের একটি সাধারণ প্রদর্শন। ডেটা সংগ্রহ করতে এবং মডেলটি তৈরি করতে যে 2-3 ঘন্টা লেগেছে তা তার সম্পূর্ণ সম্ভাবনা দেখানো থেকে অনেক দূরে। বাস্তবে, রিয়েল এস্টেট শিল্পে রিগ্রেশন বিশ্লেষণের জন্য সম্পত্তির মূল্যায়নের বাইরে বিভিন্ন ধরনের ব্যবহার রয়েছে যার মধ্যে রয়েছে:
ভূ-স্থানিক মডেলিং রিগ্রেশন বিশ্লেষণের নীতিগুলিকে রিয়েল এস্টেটের তিনটি সবচেয়ে গুরুত্বপূর্ণ জিনিসের সাথে যুক্ত করে:অবস্থান, অবস্থান, অবস্থান। আট বছর ধরে আবাসিক বিকাশকারী হিসাবে কাজ করে আমি ভূ-স্থানিক মডেলিংয়ের ক্ষমতা প্রমাণ করতে পারি। ArcGIS ব্যবহার করে, আমি উত্তর ক্যারোলিনার পাহাড়ে উন্নয়নের জন্য আদর্শ বৈশিষ্ট্যগুলি খুঁজে পেতে বিক্রয় ডেটা, পার্সেল মানচিত্র এবং লিডার ডেটা অন্তর্ভুক্ত করতে সক্ষম হয়েছি৷
আমার অভিজ্ঞতার ভিত্তিতে, রিয়েল এস্টেটের বেশিরভাগ অর্থ একটি প্রকল্পের উন্নয়নে নয় অধিগ্রহণে তৈরি হয়। অন্যরা মিস করে এমন সুযোগগুলি সনাক্ত করতে সক্ষম হওয়া রিয়েল এস্টেটের ক্ষেত্রে একটি দুর্দান্ত প্রতিযোগিতামূলক সুবিধা হতে পারে। জিওস্পেশিয়াল অ্যানালিটিক্স এমন একটা জিনিস যা বড় কোম্পানিগুলো বহু বছর ধরে সুবিধা নিয়েছে, কিন্তু ছোট কোম্পানিগুলো প্রায়ই উপেক্ষা করে।
খুব কম লোকই পরিসংখ্যানকে তাদের প্রিয় বিষয় হিসাবে মূল্যায়ন করবে। In fact, as a whole people are very bad at understanding even basic probabilities. If you’re doubtful of this opinion, take a trip to Las Vegas or Macau. Unfortunately, this can make it difficult to determine who to trust when you’re looking for advice on implementing regression analysis in your process. Here are some key things to look for when evaluating potential candidates
While people are bad at judging probabilities, intuition is actually rather good at detecting lies. You should be very skeptical of anyone who claims to be able to build a model that will answer all your questions! Don’t trust a guarantee of results. Hopefully, this article has illustrated the fact that regression analysis is based on empirical observation and sound science. It will always be the case that certain things are easier to predict than others. A trusted advisor will be open and honest when they can’t find the answers you’re looking for, and they won’t run through your budget trying to find one that isn’t there.
Look for Mr. Spock instead of Captain Kirk. Sound research can be an excellent marketing tool, but far too often people pay for sexy marketing materials with a whiff of pseudo-research and no logic to back it up. Some people are naturally more analytical, but great analytical skills come from practice. Ideally, anyone you hire to analyze data for your business will have experience finding solutions to a wide variety of problems. Someone with a narrow focus may be more susceptible to groupthink, especially when their experiences closely mirror your own.
Put potential candidates on the spot with questions that help demonstrate their reasoning abilities. This is not the time to rely on behavioral questions alone. Ideal candidates will have the ability to strategically use known information to reasonably estimate the answer to complex problems. Ask logical reasoning questions, like “How many tennis balls could you fit in the Empire State Building?”
Finally, you should look for someone with whom you can communicate. All of the information in the world won’t help if you can’t put it to good use. If someone uses so much jargon in an introductory conversation that your eyes start to glaze over, then they probably aren’t the right fit for your company.