MACHINE LEARNING ALGORITHMS IN TAMIL | இயந்திரக் கற்றல் அல்காரிதங்கள்

MACHINE LEARNING ALGORITHMS IN TAMIL | இயந்திரக் கற்றல் அல்காரிதங்கள்

MACHINE LEARNING ALGORITHMS IN TAMIL:

இயந்திரக் கற்றல் (ML) அல்காரிதங்கள் நெட்ஃப்ளிக்ஸ் பரிந்துரைகள் முதல் நிதி நிறுவனங்களில் மோசடி கண்டறிதல் வரை அனைத்திற்கும் முதுகெலும்பாக செயல்படுகின்றன. இந்த அல்காரிதங்கள் புத்திசாலியான கணினி அமைப்புகளின் மையமாக இருந்து, நிறுவனங்களுக்கு முறைகளை பகுப்பாய்வு செய்ய, முடிவுகளை கணிக்க, மற்றும் தானியங்கி முடிவெடுக்க உதவுகின்றன. பல்வேறு அல்காரிதங்கள் கிடைப்பதால், அவற்றின் பலன்கள் மற்றும் பயன்பாட்டு வழிகளைக் கவனமாகப் புரிந்துகொள்வது தரவியல் அறிவியல், செயற்கை நுண்ணறிவு (AI), அல்லது இயந்திரக் கற்றலில் ஈடுபடுபவர்களுக்கு அவசியம்.

MACHINE LEARNING ALGORITHMS IN TAMIL

இந்தக் கட்டுரை முக்கியமான 15 இயந்திரக் கற்றல் (Machine Learning) அல்காரிதங்களை விளக்குகிறது, அவற்றின் முக்கியக் கருத்துகள் மற்றும் உண்மையான உலகில் உள்ள பயன்பாடுகளை குறிப்பிடுகிறது, உங்கள் அடிப்படை புரிதலை வலுப்படுத்த உதவுகிறது. நீங்கள் ஒரு தொடக்கநிலையாராக இருந்தாலும் அல்லது அனுபவமிக்க தரவியல் நிபுணராக இருந்தாலும், இந்த அல்காரிதங்களைப் புரிந்துகொள்வது இயந்திரக் கற்றல் துறையில் சிறந்து விளங்குவதற்கு அவசியம்.

MACHINE LEARNING ALGORITHMS IN TAMIL | இயந்திரக் கற்றல் அல்காரிதம் என்றால் என்ன?

இயந்திரக் கற்றல் (Machine Learning) அல்காரிதம் என்பது ஒரு கணினிக்கு தரவிலிருந்து கற்றுக்கொண்டு, தெளிவாக நிரலாக்கம் செய்யாமல் எதிர்பார்ப்புகள் அல்லது முடிவுகளை எடுக்க உதவும் விதிமுறைகள் அல்லது செயல்முறைகளின் தொகுப்பாகும். நிரந்தரக் கட்டளைகளைப் பின்பற்றுவதற்குப் பதிலாக, இந்த அல்காரிதங்கள் தரவிலுள்ள முறைகளை (patterns) கண்டறிந்து, அதிக தகவல்களைப் பெறும்போது தங்களை மேம்படுத்திக் கொள்கின்றன. இதன் மூலம், கணினிகள் அனுபவத்திலிருந்து கற்றுக்கொண்டு புத்திசாலித்தனமாக முடிவுகள் எடுக்கலாம், இது மனிதர்கள் எடுத்துக்காட்டுகள் மூலம் கற்றுக்கொள்வதற்கு ஒத்ததாகும்.

சிக்கலான உண்மையான உலக தரவுப் பிரச்சினைகளை தீர்ப்பதற்காக சில சிறப்பான இயந்திரக் கற்றல் அல்காரிதங்கள் உருவாக்கப்பட்டுள்ளன. கீழே உள்ள அல்காரிதங்கள், அவை செயல்படும் திறன், பல்வேறு பணிகளில் அவற்றின் பொருந்தக்கூடிய தன்மை மற்றும் பெரிய தரவுத் தொகுப்புகளில் (Big Data) பயன்படுத்தும் பயன்தன்மை ஆகியவற்றின் அடிப்படையில் வரிசைப்படுத்தப்பட்டுள்ளன.

1.MACHINE LEARNING ALGORITHMS IN TAMIL | Linear Regression Algorithm:

நேரியல் மீளிணைப்பு (Linear Regression) அல்காரிதம் நேரியல் மீளிணைப்பு (Linear Regression) அல்காரிதம் ஒரு சுயாதீன மாறி (Independent Variable) மற்றும் சார்பு மாறி (Dependent Variable) ஆகியவற்றுக்கிடையேயான தொடர்பைக் காண்பிக்கிறது. சுயாதீன மாறியில் ஏதேனும் மாற்றம் ஏற்பட்டால், சார்பு மாறி எப்படி பாதிக்கப்படுகிறது என்பதை இது விளக்குகிறது. எனவே, சுயாதீன மாறி விளக்கத்திற்கான மாறி (Explanatory Variable) என அழைக்கப்படுகிறது, மேலும் சார்பு மாறி ஆர்வத்திற்குரிய காரணி (Factor of Interest) என அழைக்கப்படுகிறது.

ஒரு எடுத்துக்காட்டின் மூலம் நேரியல் மீளிணைப்பு (Linear Regression) அல்காரிதத்தைப் புரிந்துகொள்வோம்

வீட்டின் விலையை பல்வேறு காரணிகளின் அடிப்படையில் கணிக்க இந்த அல்காரிதம் எவ்வாறு உதவுகிறது என்பதைப் பார்க்கலாம்:

தரவுத்தொகுப்பை சேகரிக்கவும் – முன்பே அறியப்பட்ட விலையுடன் வீடுகளின் விவரங்களை சேகரிக்க வேண்டும். இதில் வீட்டு அளவு (சதுர அடியில்), படுக்கையறைகளின் எண்ணிக்கை, வீட்டின் வயது போன்ற அம்சங்கள் இடம்பெறும்.

மூலக்காரணிகளை அடையாளம் காணவும் – வீட்டு விலையை பாதிக்கக்கூடிய முக்கிய அம்சங்களை தேர்வு செய்ய வேண்டும்.

மாதிரியை பயிற்றுவிக்கவும் – தரவுகளைப் பயன்படுத்தி, கணிக்கப்பட்ட விலை மற்றும் உண்மையான விலை இடையேயான வேறுபாட்டை குறைக்கும் சிறந்த நேரியல் சமன்பாட்டை (Best-Fitting Line) கண்டுபிடிக்க வேண்டும்.

புதிய வீடுகளுக்கான விலைகளை கணிக்கவும் – பயிற்சி முடிந்த மாதிரியைப் பயன்படுத்தி, புதிய வீடுகளின் அம்சங்களை அடிப்படையாகக் கொண்டு அவற்றின் விலைகளை கணிக்கலாம்.

துல்லியத்தைக் பரிசோதிக்கவும் – அறியப்பட்ட விலையுடன் தனியான சில வீடுகளை வைத்து மாதிரியின் செயல்திறனை மதிப்பீடு செய்யலாம்.

நேரியல் மீளிணைப்பு அல்காரிதம் வீட்டு விலைகளை திறமையாக மதிப்பீடு செய்ய உதவுவதால், விற்பனையாளர்கள் மற்றும் வாங்குவோருக்கு மதிப்புமிக்க நுண்ணறிவுகளை வழங்கும்.

2. MACHINE LEARNING ALGORITHMS IN TAMIL | Logistic Regression Algorithm

தொடர்பியல் மீளிணைப்பு (Logistic Regression) அல்காரிதம் discrete (துண்டிக்கப்பட்ட) மதிப்புகளை கையாளுவதால், தொடர்ச்சியான மதிப்புகளை கணிக்க உதவும் நேரியல் மீளிணைப்பு (Linear Regression) அல்காரிதத்திலிருந்து வேறுபடுகிறது.

இது இருபொளிவு வகைப்பாடு (Binary Classification) செய்ய மிகவும் பொருத்தமானது. ஒரு நிகழ்வு நடந்தால் 1 என வகைப்படுத்தப்படுகிறது, நிகழவில்லை என்றால் 0 என வகைப்படுத்தப்படுகிறது. இதன் மூலம், கொடுக்கப்பட்ட முன்னறிவிப்பு மாறிகள் (Predictor Variables) அடிப்படையில் ஒரு நிகழ்வு நிகழும் வாய்ப்பு கணிக்கப்படுகிறது.

உதாரணமாக, கடன் தரப்பட்ட நபர் கடனை திருப்பிச் செலுத்துவாரா இல்லையா என்பதை இந்த அல்காரிதம் தீர்மானிக்க முடியும்.

ஒரு எடுத்துக்காட்டின் மூலம் தொடர்பியல் மீளிணைப்பு (Logistic Regression) அல்காரிதத்தைப் புரிந்துகொள்வோம்

ஒரு வாடிக்கையாளர் ஒரு சந்தா சேவையிலிருந்து வெளியேறுவாரா (Churn) என்பதை கணிக்க, இந்த அல்காரிதம் எவ்வாறு உதவுகிறது என்பதைப் பார்ப்போம்:

வாடிக்கையாளர் தரவை சேகரிக்கவும் – வயது, சந்தா திட்டம், பயன்பாட்டு அதிர்வு, கட்டண வரலாறு போன்ற விவரங்களைப் பெற வேண்டும்.

விலகலை பாதிக்கும் காரணிகளை அடையாளம் காணவும் – வாடிக்கையாளர் ஈடுபாடு (Engagement Level), திருப்தி (Satisfaction Level) போன்ற அம்சங்கள் முக்கிய பங்காற்றலாம்.

மாதிரியை பயிற்றுவிக்கவும் – இந்த தரவுகளைப் பயன்படுத்தி, விலகல் நிகழும் வாய்ப்பை தீர்மானிக்கும் முக்கிய அம்சங்களுக்கு எதற்கெல்லாம் எவ்வளவு எடை (Coefficients) கொடுக்கலாம் என்பதைக் கணிக்க வேண்டும்.

புதிய வாடிக்கையாளர் விவரங்களை உள்ளிடவும் – ஒரு புதிய வாடிக்கையாளரின் அம்சங்களை வைத்து, அவர் விலகலுக்கு உட்படுவாரா இல்லையா என்பதை 1 அல்லது 0 ஆக வகைப்படுத்தலாம்.

துல்லியத்தைக் பரிசோதிக்கவும் – ஒரு தனியான தரவுத்தொகுப்பில் மாதிரியைச் சோதித்து, துல்லியம் (Accuracy), நிச்சயத்தன்மை (Precision) மற்றும் மீளழைப்பு (Recall) ஆகியவற்றை மதிப்பீடு செய்து தேவையான மேம்பாடுகளைச் செய்யலாம்.

இந்த அல்காரிதம் நிறுவனம் வாடிக்கையாளர் நடத்தையை புரிந்துகொண்டு, விலகலைத் தடுக்கும் முறைகளை முன்னறிவிப்பதற்கும் உதவுகிறது.

தொடர்பியல் மீளிணைப்பு (Logistic Regression) அல்காரிதத்தைப் பயன்படுத்தி, நிறுவனங்கள் வாடிக்கையாளர் விலகலை (Churn) முன்னறிவித்து, அவர்களை தக்கவைக்க தேவையான நடவடிக்கைகளை எடுக்க முடியும். இது, ஒரு உன்னிப்பான மேலாளர் வாடிக்கையாளர்களின் விருப்பங்களை கணித்து, அவர்களின் திருப்தி மற்றும் நம்பகத்தன்மையை அதிகரிக்கும் முறையைப் போன்றதாகும்.

3. MACHINE LEARNING ALGORITHMS IN TAMIL | Decision Trees Algorithm:

முடிவுக்கிளைகள் (Decision Trees) அல்காரிதம் ஒரு மேற்பார்வை இயந்திரக் கற்றல் (Supervised Machine Learning) தொழிநுட்பமாகும், இது வகைப்பாடு (Classification) மற்றும் மீளிணைப்பு (Regression) பணிகளுக்கு பயன்படுத்தப்படுகிறது.

இந்த அல்காரிதம் தரவிலிருந்து எளிய முடிவு விதிகளை (Decision Rules) கற்றுக்கொண்டு, இலக்குக் காரணி (Target Variable) மதிப்பைக் கணிக்க ஒரு மாதிரியை உருவாக்குகிறது.

ஒரு எடுத்துக்காட்டின் மூலம் முடிவுக்கிளைகள் (Decision Trees) அல்காரிதத்தைப் புரிந்துகொள்வோம்

ஒரு வாடிக்கையாளர் ஒரு பொருளை வாங்குவாரா என்பதைக் கணிக்க இந்த அல்காரிதம் எவ்வாறு உதவுகிறது என்பதைப் பார்ப்போம்:

வாடிக்கையாளர் அம்சங்களை சேகரிக்கவும் – வயது, வருமானம், உலாவல் நடத்தை (Browsing Behavior) போன்ற விவரங்களைப் பெற்றுக்கொள்ள வேண்டும். ஒவ்வொரு வாடிக்கையாளருக்கும் வாங்கியதா இல்லையா (Yes/No) என குறியிடப்பட்டிருக்க வேண்டும்.

முக்கிய காரணிகளை அடையாளம் காணவும் – வருமானம், பொருளின் மீது உள்ள விருப்பம் போன்ற அம்சங்கள் வாடிக்கையாளரின் முடிவைத் தாக்கும் முக்கிய காரணிகள்.

முடிவுக்கிளை (Decision Tree) அமைப்பை உருவாக்கவும் – தரவின் அம்சங்கள் அடிப்படையில் கிளைகள் பிரிக்கப்பட்டு, எந்த வழியில் முன்னேறுவது என்பதை முடிவு செய்யும் விதமாக ஒரு மர வடிவ அமைப்பு உருவாகும்.

புதிய வாடிக்கையாளர்களுக்கான முன்னறிவிப்புகளை செய்யவும் – புதிய வாடிக்கையாளர்களின் அம்சங்களைப் பயன்படுத்தி, அவர்கள் பொருளை வாங்குவார்களா என்பதைக் கணிக்கலாம்.

மாதிரியின் துல்லியத்தைக் பரிசோதிக்கவும் – தனியாக வைத்திருக்கும் ஒரு பரிசோதனைத் தரவுத்தொகுப்பில் மாதிரியைச் சோதித்து, துல்லியம் (Accuracy) மற்றும் தேவையான மாற்றங்களைச் செய்யலாம்.

இந்த அல்காரிதம் நிறுவனம் வாடிக்கையாளர்களின் வாங்கும் விருப்பங்களை புரிந்து கொண்டு, இலக்குவழியான (Targeted) விற்பனை உத்திகளை மேம்படுத்த உதவுகிறது.

4. MACHINE LEARNING ALGORITHMS IN TAMIL | K-Nearest Neighbours Algorithm(KNN)

K-அருகிய அண்டை (K-Nearest Neighbors – KNN) அல்காரிதம் தரவுப் புள்ளிகளை ஒத்த தன்மைகளை அடிப்படையாகக் கொண்டு வெவ்வேறு வகுப்புகளாக பிரிக்கிறது. இது பொதுவாக தூரக் கணிப்பு செயல்பாடு (Distance Function) போன்ற ஒரே மாதிரியான அளவீடுகளை பயன்படுத்துகிறது.

புதிய தரவுப் புள்ளிக்கான முன்னறிவிப்பு செய்ய, இந்த அல்காரிதம் முழு தரவுத்தொகுப்பில் இருந்து K மிக அதிக ஒற்றுமை கொண்ட (அண்டை) மாதிரிகளை தேடுகிறது. பின்னர், அந்த K அண்டை மாதிரிகளின் வெளிப்பாட்டு மாறி (Output Variable) அடிப்படையில் முடிவை எடுக்கிறது.

K-அருகிய அண்டை (K-Nearest Neighbors – KNN) அல்காரிதத்தை ஒரு எடுத்துக்காட்டின் மூலம் புரிந்துகொள்வோம்:

பூக்களை வகைகளாக (Species) வகைப்படுத்த இந்த அல்காரிதம் எவ்வாறு உதவுகிறது என்பதைப் பார்ப்போம்:

தரவை சேகரிக்கவும் – மலர்களின் தண்டு நீளம், இதழ் அகலம் (Petal Length & Width) மற்றும் அதன் வகை (Species Label) போன்ற அம்சங்களைச் சேகரிக்க வேண்டும்.

முக்கிய அம்சங்களை தேர்வு செய்யவும் – வகைப்பாட்டிற்கு பாதிப்பை ஏற்படுத்தக்கூடிய முக்கிய அம்சங்களை அடையாளம் காண வேண்டும். இதில் மலரின் இதழ்களின் பரிமாணங்கள் முக்கிய பங்காற்றலாம்.

பொதுமையான அளவுகளை பரிசோதிக்கவும் – KNN ஒரு பராமிதியற்ற (Non-Parametric) அல்காரிதம் என்பதால், துல்லியமான தூரக் கணிப்புகளுக்கு (Distance Calculation) அனைத்து அம்சங்களையும் சரிசெய்து சாதாரண நிலை (Normalization) கொண்டு வர வேண்டும்.

புதிய மலருக்கான வகை கண்டுபிடிக்கவும் – ஒரு புதிய மலரின் அம்சங்களை கொண்டு, தரவுத் தொகுப்பில் உள்ள அனைத்து மலர்களுடனும் தூரம் கணக்கிட்டு, அதற்கு அருகிலுள்ள K அண்டை மலர்களை (Neighbors) அடையாளம் காண வேண்டும். அதிலேயே அதிகமானது எந்த வகையைச் சார்ந்ததோ, அதே வகையில் புதிய மலரையும் வகைப்படுத்தலாம்.

மாதிரியை சோதித்து மேம்படுத்தவும் – தனியான ஒரு சோதனைத் தரவுத்தொகுப்பில் மாதிரியை இயக்கி, துல்லியத்தைக் கணக்கிட வேண்டும். தேவையெனில், K மதிப்பை (அண்டை எண்ணிக்கை) சரிசெய்து விளைவுகளை மேம்படுத்தலாம்.

KNN அல்காரிதம், குறிப்பாக இயற்கையில் ஒருவருக்கொருவர் ஒத்த வகைப்பாட்டு பிரிவுகளுக்கு (Classification Problems) மிகவும் பயனுள்ளதாகும்.

5. MACHINE LEARNING ALGORITHMS IN TAMIL | Naive Bayes Classifier Algorithm:

நைவ் பயேஸ் வகைப்பாடு (Naive Bayes Classifier) ஒரு மேற்பார்வை இயந்திரக் கற்றல் (Supervised Machine Learning) அல்காரிதம், இது வகைப்பாட்டு (Classification) பணிகளுக்கு பயன்படுத்தப்படுகிறது.

இந்த அல்காரிதம் பயேஸ் கோட்பாட்டின் (Bayes’ Theorem) அடிப்படையில் செயல்படுகிறது. இது ஒரு தரவுப் புள்ளி எந்த வகைக்குச் சேர்ந்திருக்கலாம் என்பதை அதன் அம்சங்களின் அடிப்படையில் வாய்ப்பு (Probability) கணக்கிட்டு தீர்மானிக்கிறது.

நைவ் பயேஸ் வகைப்பாட்டு (Naïve Bayes Classifier) அல்காரிதத்தை ஒரு எடுத்துக்காட்டின் மூலம் புரிந்துகொள்வோம்

Gmail இல் வரும் மின்னஞ்சல்களை “ஸ்பாம்” (Spam) அல்லது “ஸ்பாம் அல்லாதவை” (Not Spam) என வகைப்படுத்த இந்த அல்காரிதம் எவ்வாறு உதவுகிறது என்பதைப் பார்ப்போம்:

தரவுத்தொகுப்பை உருவாக்கவும் – முன்னதாக ஸ்பாம் மற்றும் இயல்பு மின்னஞ்சல்கள் (Legitimate Emails) என வகைப்படுத்தப்பட்ட ஒரு தரவுத்தொகுப்பை சேகரிக்க வேண்டும்.

முக்கிய அம்சங்களை அடையாளம் காணவும் – சில சொற்கள் (“Free”, “Winner”, “Congratulations”) அல்லது மின்னஞ்சலின் இணைப்புகளின் எண்ணிக்கை (Number of Links) போன்ற அம்சங்கள் முக்கியமான வகைப்பாட்டு காரணிகள் ஆக இருக்கலாம்.

நைவ் பயேஸ் வகைப்பாட்டாளரை பயிற்சி அளிக்கவும் – ஒவ்வொரு அம்சத்திற்கும் ஸ்பாம் மின்னஞ்சலாக இருப்பதற்கான வாய்ப்பினை (Probability) Bayes’ Theorem அடிப்படையில் கணக்கிட வேண்டும்.

புதிய மின்னஞ்சல்களை வகைப்படுத்தவும் – புதிதாக வரும் மின்னஞ்சலின் அம்சங்களைப் பொருத்தி, அது ஸ்பாம் ஆக இருக்க வாய்ப்பு (Likelihood) அதிகமா அல்லது இயல்பு மின்னஞ்சலா என்பதைக் கணிக்க வேண்டும்.

மாதிரியைச் சோதித்து துல்லியத்தை மேம்படுத்தவும் – தனியாக வைத்திருக்கும் பரிசோதனைத் தரவுத்தொகுப்பில் மாதிரியைச் சோதித்து, துல்லியம் (Accuracy) மற்றும் தேவையான மாற்றங்களைச் செய்யலாம்.

இந்த அல்காரிதம், பயன்படுத்த எளிதானது மற்றும் வேகமாக செயல்படக்கூடியது என்பதால், ஸ்பாம் கண்டறிதல் (Spam Detection), உணர்வுப்பூர்வ பகுப்பாய்வு (Sentiment Analysis), மொழி இனங்காணுதல் (Language Detection) போன்ற பயன்பாடுகளில் மிகவும் பயனுள்ளதாக உள்ளது.

6. MACHINE LEARNING ALGORITHMS IN TAMIL | K-Means Clustering Algorithm:

K-மீன்ஸ் க்ளஸ்டரிங் என்பது மேற்பார்வையற்ற (Unsupervised) இயந்திரக் கற்றல் (Machine Learning) தொழினுட்பம், இது தரவுகளை ஒரே மாதிரியான அம்சங்கள் அடிப்படையில் தனித்துவமான குழுக்களாக (Clusters) பிரிக்க உதவுகிறது.

இந்த அல்காரிதம் பல துறைகளில் பயன்படுத்தப்படுகிறது, குறிப்பாக:

சந்தைப்படுத்தல் (Marketing) – வாடிக்கையாளர்களை அவர்கள் நடவடிக்கைகளின் அடிப்படையில் குழுக்களாக பிரிக்க.

பட செயலாக்கம் (Image Processing) – வண்ணங்களை (Colors) அடிப்படையாகக் கொண்டு படங்களை பகுக்க.

சமூக வலைப்பின்னல் பகுப்பாய்வு (Social Network Analysis) – ஒரே மாதிரியான தொடர்புகள் உள்ள குழுக்களை இனங்காண.

K-மீன்ஸ் க்ளஸ்டரிங் (K-Means Clustering) அல்காரிதத்தை வாடிக்கையாளர் பகுப்பாய்வில் பயன்படுத்துவதைப் பார்ப்போம்:

Retail கடைகளில் வாடிக்கையாளர்களை பிரிப்பதற்கான (Customer Segmentation) ஒரு எடுத்துக்காட்டாக, K-Means அல்காரிதம் எவ்வாறு உதவுகிறது என்பதைப் பார்ப்போம்:

வாடிக்கையாளர் தரவைச் சேகரிக்கவும் – வாடிக்கையாளர்களின் வயது, வாங்கிய பொருட்களின் வரலாறு (Purchase History), செலவீட்டு பழக்கம் (Spending Behavior) போன்ற அம்சங்களை சேகரிக்க வேண்டும்.

குழு எண்ணிக்கையை தீர்மானிக்கவும் – எத்தனை வகையான வாடிக்கையாளர் குழுக்கள் (குழுமங்கள்/Clusters) தேவையென்பதை தீர்மானிக்க வேண்டும். (உதாரணம்: அதிக செலவாளர்கள், வழக்கமான வாங்குபவர்கள், சற்றே குறைவாக செலவு செய்பவர்கள்)

தற்காலிக மையங்களை (Centroids) தேர்வு செய்யவும் – ஆரம்பத்தில் K (குழுக்களின் எண்ணிக்கை) மையங்களை முறையற்ற முறையில் தேர்ந்தெடுக்க வேண்டும்.

வாடிக்கையாளர்களை குழுக்களாகப் பிரிக்கவும் – ஒவ்வொரு வாடிக்கையாளரும் எந்த மையத்திற்கும் (Centroid) மிக அருகிலோ, அந்த குழுவில் சேர்க்கப்படுவார்.

கணக்கீட்டினை திரும்பச் செய்யவும் – ஒவ்வொரு சுழற்சிக்கும் (Iteration) மையங்களை புதுப்பிக்கவும், ஒவ்வொரு வாடிக்கையாளரின் குழு உறுப்புமாற்றத்தை (Reassignment) செய்யவும். இதை மையங்கள் நிலையான (Centroids Stabilize) நிலைக்கு வரும் வரை தொடரலாம்.

இந்த வகையான குழுமமயமாக்கல் (Clustering) சந்தைப்படுத்தல் உத்திகள் (Marketing Strategies), தனிப்பயன் சலுகைகள் (Personalized Offers), மற்றும் வாடிக்கையாளர் போக்குகளை (Customer Behavior Trends) புரிந்து கொள்ள சிறப்பாக பயன்படும்.

7. MACHINE LEARNING ALGORITHMS IN TAMIL | Support Vector Machine Algorithm

சப்போர்ட் வெக்டர் மெஷின் (SVM) என்பது வகைப்பாட்டு (Classification) மற்றும் மீள்பார்வை (Regression) பிரச்சினைகளுக்குப் பயன்படுத்தப்படும் ஒரு சக்திவாய்ந்த இயந்திரக் கற்றல் (Machine Learning) அல்காரிதம் ஆகும்.

இந்த அல்காரிதத்தில், தரவு வெவ்வேறு வகைகளாக பிரிக்கப்படுகின்றது. இதற்காக, ஒரு குறிப்பிட்ட கோடு அல்லது ஹைப்பர்பிளேன் (Hyperplane) கண்டறியப்படுகிறது, இது தரவுத்தொகுப்பை பல்வேறு வகைகளாக பிரிக்கும்.

SVM அல்காரிதத்தின் முக்கிய நோக்கம்:

அதிகபட்ச விளிம்பு (Margin Maximization) – தரவுக் கிளாசுகளுக்கிடையே இருக்கும் இடைவெளியை (Margin) அதிகப்படுத்தும் சிறந்த ஹைப்பர்பிளேனை கண்டுபிடிக்கும்.

உயர் பரிமாணங்கள் (High-Dimensional Data) ஆதரவு – குறிப்பாக பல்வேறு அம்சங்களைக் கொண்ட தரவுகளுடன் சிறப்பாக செயல்படும்.

முக்கிய தரவுப் புள்ளிகள் (Support Vectors) – இந்த ஹைப்பர்பிளேனை முக்கியமான சில தரவுப் புள்ளிகள் (Support Vectors) தீர்மானிக்கின்றன.

SVM அல்காரிதம் பட இனங்காணுதல் (Image Recognition), மருத்துவ கண்டுபிடிப்புகள் (Medical Diagnosis), மற்றும் உரை வகைப்பாடு (Text Classification) போன்ற பல துறைகளில் பயன்படுத்தப்படுகிறது.

எஸ்விஎம் (SVM) அல்காரிதத்தைப் பயன்படுத்தி பூனைகள் மற்றும் நாய்களின் படங்களை வகைப்படுத்துதல்

SVM அல்காரிதம் எவ்வாறு பூனைகள் (Cats) மற்றும் நாய்கள் (Dogs) ஆகியவற்றை படங்களின் அடிப்படையில் வகைப்படுத்த உதவுகிறது என்பதைப் பார்ப்போம்:

தரவுத்தொகுப்பை சேகரிக்கவும் – பூனைகள் மற்றும் நாய்களின் பல்வேறு படங்களைப் பயன்படுத்தி ஒரு தரவுத்தொகுப்பை உருவாக்கவும்.

புதிய அம்சங்களை (Features) பிரித்தெடுக்கவும் – படங்களிலிருந்து வடிவம் (Shape), நிறம் (Color), மற்றும் அமைப்புமுறை (Texture) போன்ற முக்கிய அம்சங்களை பிரித்தெடுக்க வேண்டும்.

முன்னறிவிப்பு மாடலைப் (Train Model) பயிற்சி அளிக்கவும் – இந்த அம்சங்களை அடிப்படையாகக் கொண்டு SVM மெஷின் சிறந்த ஹைப்பர்பிளேனை (Hyperplane) கண்டுபிடிக்க பயிற்சி செய்யும்.

பிரித்தெடுக்கப்பட்ட அம்சங்களைப் பயன்படுத்தி பகுப்பாய்வு செய்யவும் – புதிய படங்களுக்காக SVM பயிற்சியான மாதிரியை (Trained Model) பயன்படுத்தி, பூனை அல்லது நாய் என்று சரியாக வகைப்படுத்துவதை முயற்சி செய்யும்.

சரிபார்ப்பு மற்றும் துல்லியத்தைக் கணிக்கவும் – மாடல் சரியாக செயல்படுகிறதா என ஒரு தனி சோதனை தொகுப்பில் (Test Dataset) செயல்படுத்தி, துல்லியம் (Accuracy), நினைவுத்திறன் (Recall), மற்றும் அம்பிகை மதிப்பீடு (Precision) ஆகியவற்றை கணிக்க வேண்டும்.

SVM அல்காரிதம் உயர் துல்லியத்துடன் (High Accuracy) வேலை செய்கிறது மற்றும் குறுகிய தரவுத்தொகுப்புகளிலும் சிறப்பாக செயல்படக்கூடியது என்பதால், இது பட இனங்காணுதல் (Image Classification) மற்றும் உரை பகுப்பாய்வு (Text Analysis) போன்ற பயன்பாடுகளுக்கு சிறந்ததாக இருக்கும்.

8. MACHINE LEARNING ALGORITHMS IN TAMIL | Apriori Algorithm:

அப்ரியோரீ (Apriori) அல்காரிதம் என்பது கூட்டு விதிகள் (Association Rules) உருவாக்குவதற்காக பயன்படுத்தப்படும் ஒரு நுண்ணறிவு முறையாகும். இது “IF-THEN” (நிகழ்வு A நடந்தால், நிகழ்வு B நிகழும்) என்ற வடிவத்தில் விதிகளை உருவாக்குகிறது.

அல்காரிதத்தின் முக்கிய அம்சங்கள்:

அதிகமான பொருட்கள் சேரும் சமுகங்களை (Frequent Itemsets) கண்டறிதல் – மொத்த தரவுத்தொகுப்பிலிருந்து ஒரு பொருள் அல்லது பொருட்கள் அடிக்கடி தோன்றுமா என்பதை பார்க்கும்.

கூட்டு விதிகளை உருவாக்குதல் – பொருட்கள் அல்லது நிகழ்வுகளுக்கிடையே உறவுகளை (Relationships) கண்டறிந்து, எந்த பொருளின் இணைப்பு மற்றொன்றை பாதிக்கிறது என்பதை நுட்பமாக கணிக்க உதவுகிறது.

வர்த்தகச் சங்கிலிகள் (Retail Chains), சந்தைப்படுத்தல் (Marketing), மற்றும் பரிந்துரை (Recommendation Systems) போன்றவற்றில் பயன்பாடு.

உதாரணம் – சந்தைப்படுத்தல் (Market Basket Analysis)

அப்ரியோரீ அல்காரிதம் சில்லறை விற்பனையில் (Retail Sales) எப்படி உதவுகிறது என்பதைக் காணலாம்:

பொதுவாக மக்கள் சேர்ந்து வாங்கும் பொருட்கள் – சுப்பர் மார்க்கெட் தரவுத்தொகுப்பை ஆய்வு செய்தால், “பால் வாங்கும் வாடிக்கையாளர்கள் பெரும்பாலும் ரொட்டியும் வாங்குவார்கள்” என்ற வகையில் கூட்டுப்பொருள் விதிகள் உருவாகலாம்.

IF-THEN விதி உருவாக்குதல் –

IF பால் வாங்கினால்,

THEN ரொட்டியும் வாங்கும் வாய்ப்பு அதிகம்.

விற்பனை உத்திகளை மேம்படுத்துதல் – இந்த தகவலின் அடிப்படையில், கடை Certain bundle offers (கூட்டு சலுகைகள்) வழங்கலாம், அல்லது ஒரு பொருள் அருகில் மற்றொரு பொருளை வைக்கலாம் (Cross-Selling Strategy).

அப்ரியோரீ அல்காரிதம் வாடிக்கையாளர் நடத்தை (Customer Behavior) புரிந்து கொள்ள, விற்பனை வருவாயை அதிகரிக்க, மற்றும் பரிந்துரை முறைமைகளை (Recommendation Systems) மேம்படுத்த மிகவும் பயனுள்ளதாக இருக்கும்.

அப்ரியோரீ (Apriori) அல்காரிதம் – மொத்த விற்பனை (Market Basket Analysis) உதாரணம்

அப்ரியோரீ அல்காரிதம் மொத்த விற்பனையில் வாடிக்கையாளர்கள் எவற்றை சேர்ந்து வாங்குகிறார்கள் என்பதை கண்டறிந்து, விற்பனை உத்திகளை மேம்படுத்த உதவுகிறது. இப்போது, ஒரு சில்லறை விற்பனை கடையில் இதை எவ்வாறு பயன்படுத்தலாம் என்பதைப் பார்ப்போம்:

1. பரிவர்த்தனை (Transaction) தரவுகளை சேகரித்தல்

சில்லறை விற்பனை கடையில் வாடிக்கையாளர்கள் ஒரே கொள்முதல் (Single Purchase) போது எந்த பொருட்களை சேர்த்து வாங்குகிறார்கள் என்பதைப் பட்டியலிட வேண்டும்.

உதாரணம்:

பரிவர்த்தனை 1: 🥛 பால், ரொட்டி, பட்டர்

பரிவர்த்தனை 2: 🥚 முட்டை, சீஸ், பால்

பரிவர்த்தனை 3: 🍞 ரொட்டி, பட்டர்

2. குறைந்தபட்ச ஆதரவு (Minimum Support) மற்றும் நம்பகத்தன்மை (Confidence) அமைத்தல்

அல்காரிதம் அதிகமுறை சேர்ந்து வந்த பொருட்களை மட்டும் பரிந்துரைக்க வேண்டும். அதற்கு, support & confidence என்ற மதிப்புகளை நிர்ணயிக்கலாம்.

Support – ஒரு பொருள் எத்தனை முறை திரும்பவும் தோன்றுகிறது என்பதைக் காட்டும்.

Confidence – ஒரு பொருள் வாங்கப்பட்டால், மற்றொரு பொருள் எத்தனை முறை சேர்ந்து வாங்கப்பட்டது என்பதைக் காட்டும்.

3. அதிகமுறை தோன்றும் பொருட்களை கண்டறிதல்

(பால், ரொட்டி) = 50% வாடிக்கையாளர்கள் வாங்குகிறார்கள்

(ரொட்டி, பட்டர்) = 40% வாடிக்கையாளர்கள் வாங்குகிறார்கள்

4. கூட்டு விதிகள் (Association Rules) உருவாக்குதல்

உதாரணமாக:

IF 🥛 “பால் வாங்கினால்”

THEN 🍞 “ரொட்டியும் வாங்கும் வாய்ப்பு 60%”

5. வணிக உத்திகள்

கூட்டு சலுகைகள் (Bundle Offers) – “பால் + ரொட்டி” சேர்ந்து வாங்கினால் தள்ளுபடி கொடுக்கலாம்.

கடைகளில் பொருட்கள் அமைத்தல் – “ரொட்டியின் அருகில் பட்டரை வைக்கலாம்”, ஏனெனில் இது சேர்ந்து வாங்கப்படும்.

🔹 இந்த தகவல்கள் விற்பனையை அதிகரிக்க, வாடிக்கையாளர்களின் தேவைகளை புரிந்து கொள்ள, மற்றும் நல்ல பரிந்துரை முறைமைகளை உருவாக்க உதவும்.

9. MACHINE LEARNING ALGORITHMS IN TAMIL | Random Forests Algorithm:

ரேண்டம் ஃபாரெஸ்ட் (Random Forests) அல்காரிதம் – மேம்படுத்தப்பட்ட தீர்மான மரம் (Decision Tree) முறைகள்

தீர்மான மர (Decision Tree) அல்காரிதத்தில் உள்ள ஒரு முக்கியமான குறைபாடு என்ன?

ஒரு தீர்மான மரத்தின் ஆழம் (Depth) அதிகரித்தால், அது மிகப்பெரிய அளவில் தகவல்களை ஒப்பனை (Overfitting) செய்யும் வாய்ப்பு அதிகமாகும்.

இதன் விளைவாக, புதிய தரவுகளுக்கு துல்லியமான (Accurate) முடிவுகளை வழங்க முடியாது.

Random Forests – எப்படி இதை தீர்க்கிறது?

ஒரே ஒரு மரத்தை (Single Tree) பயன்படுத்தாமல், பல்வேறு தீர்மான மரங்களை (Multiple Decision Trees) உருவாக்கி முடிவுகளை கணிக்க இது உதவுகிறது.

ஒவ்வொரு மரமும் தற்போதைய தரவின் ஒரு பகுதிக்கு (Subset of Data) பயிற்சி (Training) பெறும்.

எல்லா மரங்களின் முடிவுகளையும் இணைத்து சராசரி முடிவை (Majority Voting or Averaging) கணிக்கின்றது.

இந்த முறையில், துல்லியமான முடிவுகளை பெற முடியும் மற்றும் தகவல் ஒப்பனை (Overfitting) குறையும்.

CART (Classification and Regression Trees) – எவ்வாறு இணைக்கப்படுகிறது?

அனைத்து மரங்களின் முடிவுகளையும் ஒரு ஒருங்கிணைந்த (Ensemble) மாடலில் சேர்க்கிறது.

இது பிரித்தல் மற்றும் மீண்டும் ஒன்றாக சேர்த்தல் (Bagging and Aggregation) முறைகளை பயன்படுத்துகிறது.

🔹 Random Forests அல்காரிதம் பெரும்பாலும், மருத்துவம், நிதி சேவைகள் மற்றும் வணிக பகுப்பாய்வு (Business Analytics) போன்ற பல்வேறு துறைகளில் பரவலாக பயன்படுத்தப்படுகிறது.

ரேண்டம் ஃபாரெஸ்ட் (Random Forest) அல்காரிதம் மூலம் கடன் (Loan) அனுமதி கணிப்பு

இதன் செயல்பாட்டை ஒரு கடன் (Loan) அனுமதி கணிப்பு (Approval Prediction) எடுத்துக்காட்டின் மூலம் விளக்கலாம்:

1️ தரவுத் தொகுப்பு (Data Collection)

  • கடன் விண்ணப்பங்களின் தகவல்களை சேகரிக்க வேண்டும்.
    உள்ளடங்கும் அம்சங்கள் (Features):
    • வருமானம் (Income)
    • கடன் மதிப்பெண் (Credit Score)
    • கடன் தொகை (Loan Amount)
    • முந்தைய தவறுபாடுகள் (Previous Defaults)

2️ தரவு முன்னிலைப்படுத்தல் (Data Preprocessing)

  • காணாமல் போன (Missing) மதிப்புகளை சரி செய்ய வேண்டும்.
  • வகைப்படுத்தப்படும் (Categorical) தகவல்களை எண்களாக மாற்ற வேண்டும்.

3️ பல தீர்மான மரங்களை உருவாக்குதல் (Building Multiple Decision Trees)

  • பயிற்சி (Training) தரவின் பகுதிகளை (Subsets) எடுத்து பல்வேறு தீர்மான மரங்களை உருவாக்கலாம்.
  • ஒவ்வொரு மரமும் வேறுபட்ட அம்சங்களை (Features) கொண்டு பயிற்சி பெறும்.

4️ புதிய கடன் விண்ணப்பத்திற்கான கணிப்பு (Prediction for a New Loan Application)

  • புதிய விண்ணப்பத்திற்காக ஒவ்வொரு மரமும் ஒரு முடிவை கணிக்கின்றது (அனுமதி/மறு நிராகரிப்பு – Approved/Denied).
  • பெரும்பான்மை மரங்கள்அனுமதிஎனக் கணித்தால், கடன் வழங்கப்படும்.

5️ மாதிரியை சோதனை செய்தல் (Testing the Model)

  • துல்லியம் (Accuracy), நம்பகத்தன்மை (Precision), மீட்கும் திறன் (Recall) போன்ற அளவுகோல்களை மதிப்பீடு செய்ய வேண்டும்.
  • தயவுசெய்து கடன் வழங்கலாமா இல்லையா என்பதை நம்பிக்கையுடன் தீர்மானிக்கலாம்.

Random Forests அல்காரிதம், தனிப்பட்ட தீர்மான மரங்களை விட சரியான முடிவுகளை வழங்க அதிக வலிமை கொண்டது!

10. MACHINE LEARNING ALGORITHMS IN TAMIL | Artificial Neural Networks Algorithm(ANN)

செயற்கை நரம்பியல் கூட்டமைப்பு (Artificial Neural Network – ANN) என்றால் என்ன?

செயற்கை நரம்பியல் கூட்டமைப்பு (ANN) என்பது மனித மூளைச் செயல்பாட்டை அடிப்படையாகக் கொண்டு உருவாக்கப்பட்ட கணிப்பீட்டு மாதிரி (Computational Model) ஆகும். இது வகைப்படுத்தல் (Classification) மற்றும் மீள்பிரதிபலிப்பு (Regression) போன்ற பல்வேறு பணிகளை செய்ய பயன்படுகிறது.

🔹 ANN எப்படி செயல்படுகிறது?

இது நரம்பணுக்கள் (Neurons) அல்லது முனையங்கள் (Nodes) அடுக்குகளாக (Layers) ஏற்படுத்தப்படுகிறது.

ஒவ்வொரு நரம்பணு (Neuron) ஒரு சிறப்பு செயல்பாட்டை செய்யும்.

தகவல் ஒரு அடுக்கிலிருந்து மற்றொரு அடுக்கிற்குப் பரவுகிறது.

🔹 ANN உடன் உள்ள முக்கியமான அடுக்குகள் (Layers):

1️⃣    உள்ளீட்டு அடுக்கு (Input Layer):

முதன்முதலில் தரவை பெறும் பகுதி.

எடுத்துக்காட்டாக, ஒரு படம் அடையாளம் காணும் ANN-ல், பிக்சல்கள் (Pixels) உள்ளீடாக இருக்கும்.

2️⃣    மறை அடுக்கு (Hidden Layer):

தரவை செயலாக்கும் முக்கிய பகுதியாகும்.

பொய்க்கோவைக்க (Weights) மாற்றம் செய்து, தகவல்களை வடிகட்டுகிறது.

3️⃣    வெளியீட்டு அடுக்கு (Output Layer):

இறுதியாக முடிவுகளை வழங்கும் பகுதி.

எடுத்துக்காட்டாக, ஒரு குறிப்பு (Text) மொழிபெயர்ப்பு ANN-ல், மொழிபெயர்க்கப்பட்ட வாசகம் வெளியீடாக வரும்.

✅ ANN-கள் இயற்கையாகவே படிப்பு (Learning), தன்னியக்க மையாக்கம் (Automation), மற்றும் சிக்கலான தரவுப் பதிவுகளை (Complex Data Patterns) புரிந்துகொள்ள உதவுகிறது!

🔹ANN எவ்வாறு படங்களை அடையாளம் காண உதவுகிறது?

படம் அடையாளம் காணும் செயல்முறையை (Image Recognition) ANN மூலம் விளக்கலாம்:

1️⃣    தரவுகளை சேகரித்தல்:

முன்னதாக அடையாளம் காணப்பட்ட (Labeled) படங்களை சேகரிக்க வேண்டும்.

எடுத்துக்காட்டாக, “பூனை” மற்றும் “நாய்” படங்களை தனித்தனியாக வகைப்படுத்தப்பட்ட தரவுத்தொகுப்பாக (Dataset) உருவாக்க வேண்டும்.

2️⃣    படங்களை சாதாரணமாக்கல் (Normalization) மற்றும் தரவுத்தொகுப்பு பிரித்தல்:

படங்களின் அளவை ஒரே மாதிரியாக மாற்றி (Resizing), ஒளி மாற்றங்களை சீராக்க வேண்டும்.

தரவுத்தொகுப்பை பயிற்சி (Training), சரிபார்ப்பு (Validation), மற்றும் சோதனை (Testing) என மூன்று பிரிவாகப் பிரிக்க வேண்டும்.

3️⃣    ANN பயிற்சி (Training) மற்றும் எடை மாற்றங்கள் (Weight Adjustments):

பயிற்சி தரவினை ANN-க்கு வழங்கி, எடைகள் (Weights) மாற்றப்பட்டு மெல்ல தரவுகள் துல்லியமாக புரிந்து கொள்ளப்படும்.

இதற்காக முன்னேற்றப் பரவல் (Forward Propagation) மற்றும் பின்பக்கப் பரவல் (Backpropagation) முறைகள் பயன்படுத்தப்படும்.

குறைவீட்டு வழிமுறைகள் (Optimization Algorithms) – உதாரணமாக, ‘சாய்வு இறங்கல்’ (Gradient Descent) பயன்படுத்தப்படும்.

4️⃣    புதிய படங்களை வகைப்படுத்துதல் (Classification):

பயிற்சி முடிந்தவுடன், ANN-ஐ புதிய படங்களின் தரவுகளை வழங்கி அவை எந்த வகையைச் சேர்ந்தவை என்று கணிக்கலாம்.

எடுத்துக்காட்டாக, ஒரு புதிய படம் “பூனை” அல்லது “நாய்” என சரியாக அடையாளம் காணப்பட்டதா என்பதைANN முடிவு செய்யும்.

5️⃣    மாதிரியை சோதித்து செயல்திறன் மதிப்பீடு செய்யுதல்:

மாதிரியை சரிபார்ப்பு (Validation) மற்றும் சோதனை (Testing) தரவுகளில் இயக்கி, செயல்திறன் (Performance) மதிப்பீடு செய்ய வேண்டும்.

இதில் துல்லியம் (Accuracy), துல்லியமான எதிர்பார்ப்பு (Precision), மீள்முறையாக அடையாளம் காணும் திறன் (Recall) போன்ற அளவுகோல்கள் கணக்கிடப்படும்.

✅ ANN-ன் மூலம், படங்களை வேகமாகவும் துல்லியமாகவும் வகைப்படுத்தலாம். இதனால், சுயம் இயக்கக் (Automation) கருவிகள், மருத்துவ படங்களை பகுப்பாய்வு செய்வது, மற்றும் முகம் அடையாளம் காணும் செயல்முறைகள் போன்றவற்றில் இது பயன்படுத்தப்படுகிறது!

11. MACHINE LEARNING ALGORITHMS IN TAMIL | Principal Component Analysis (PCA)

🔹முக்கிய கூறு பகுப்பாய்வு (Principal Component Analysis – PCA) என்றால் என்ன?

PCA என்பது உயர் பரிமாண (High-Dimensional) தரவுகளை குறைந்த பரிமாணத்தில் மாற்றும் “கோண அளவீட்டு (Dimensionality Reduction)” முறை ஆகும்.

🔹 எதற்காக PCA பயன்படுத்தப்படுகிறது?

உயர் பரிமாண (High-Dimensional) தரவுகளை எளிமையாக புரிந்து கொள்ள வேண்டும்.

முக்கியமான தகவல்களை மட்டும் பாதுகாத்து (Preserve Important Variance), தேவையில்லாத தரவுகளை அகற்ற வேண்டும்.

வரிசையாக்கும், தரவுகளை உருவாக்கும், மற்றும் ஒப்பீடு செய்யும் செயல்முறைகளை எளிதாக்கும்.

🔹 PCA எவ்வாறு செயல்படுகிறது?

1️⃣    தரவுகளை ஒரே அளவாக மாற்றுதல் (Standardization):

தரவுகளில் எந்த அளவீட்டு மாறுபாடுகளும் (Scale Differences) இருக்கக்கூடாது என்பதற்காக, தரவுகள் நுண்ணிய நிலைக்கு மாற்றப்படும்.

2️⃣    கோரலேஷன் மதிப்பீடு (Covariance Matrix Computation):

தரவுகளுக்குள் எந்த மாற்றிகள் (Features) கூடிய தொடர்புடையவை, எந்த மாற்றிகள் முக்கியமானவை என்பதை கணிக்க வேண்டும்.

3️⃣    முக்கிய கூறுகளை கண்டுபிடித்தல் (Eigenvalues & Eigenvectors Calculation):

கணக்கீட்டு முறைகள் மூலம் தரவுகளில் அதிக தகவல் உள்ள (High Variance) முக்கிய கூறுகளை (Principal Components) தனித்துவைக்க வேண்டும்.

4️⃣    புதிய பரிமாண நிலைக்கு மாற்றம் (Projection to New Dimension):

உயர் பரிமாண தரவுகளை, முக்கிய கூறுகளின் அடிப்படையில் குறைந்த பரிமாணத்திற்கு மாற்ற வேண்டும்.

🔹 PCA-வின் பயன்பாடுகள்

✅ படம் மற்றும் வீடியோ அடையாளம் காணும் முறைமைகள் (Image & Video Recognition)

✅ மருத்துவ தரவுத்தொகுப்பு பகுப்பாய்வு (Medical Data Analysis)

✅ பங்குச் சந்தை முன்னறிவிப்பு (Stock Market Prediction)

✅ பிற ஆழ்ந்த கற்றல் (Deep Learning) மற்றும் இயந்திரக் கற்றல் (Machine Learning) முறைமைகள்

✨ PCA-வை பயன்படுத்துவதன் மூலம், தரவுகளை எளிதாக புரிந்து கொள்ளலாம், செயல்பாடு (Performance) அதிகரிக்கலாம், மற்றும் செயல்முறைகளை வேகமாக செய்யலாம்! 🚀

📌 PCA-வை ஒரு உதாரணம் மூலம் புரிந்துகொள்ளலாம்

🔹 தரவுத் தொகுப்பின் பரிமாணங்களை குறைத்து காண்பிப்பு (Data Visualization using PCA)

கற்பனை செய்யுங்கள், உங்கள் பரிசோதனைக்காக ஒரு உயர் பரிமாண (High-Dimensional) தரவுத்தொகுப்பு உள்ளது. இதை எளிதாக காண்பிக்க வேண்டுமென்றால், பரிமாணங்களைக் குறைக்க வேண்டும்.

PCA செயல்முறை – ஒரு எளிய விளக்கம்

✅ 1. தரவுத்தொகுப்பு உருவாக்கம் (Data Collection):

ஒவ்வொரு பதிவிலும் பல்வேறு அம்சங்கள் உள்ளன (உதாரணம்: ஒரு வணிகத்தின் வாடிக்கையாளர் தரவுகள் – வயது, வருமானம், செலவிடும் பழக்கம்).

✅ 2. தரவுகளை சீராக்குதல் (Data Normalization):

தரவின் அளவீட்டு மாறுபாடுகள் (Scale Differences) உள்ளதால், அனைத்து அம்சங்களும் சமமாக பங்களிக்க மதிப்புகள் நிலைப்படுத்தப்படும்.

✅ 3. கோரலேஷன் பகுப்பாய்வு (Covariance Matrix Calculation):

அம்சங்களுக்குள் உள்ள தொடர்புகளை (Relationships between features) கண்டறியும்.

✅ 4. Eigenvalues & Eigenvectors கணக்கீடு:

முக்கிய கூறுகளை (Principal Components) சோதித்து, தரவின் மிக அதிகமான தகவல்களை எடுத்துக்கொள்ளும் அம்சங்களை தேர்வு செய்க.

✅ 5. முக்கிய கூறுகளை தேர்வு செய்தல் (Selecting Top k Principal Components):

தரவின் மிக அதிக வேறுபாடுகளை (Variance) கொண்ட முக்கிய கூறுகளை மட்டும் தேர்வு செய்க.

✅ 6. தரவை புதிய பரிமாணத்திற்கு மாற்றுதல் (Projecting Data to Lower Dimension):

மூல தரவை (Original Data) குறைந்த பரிமாணத்திற்கு மாற்றுவதன் மூலம், 2D அல்லது 3D-ல் எளிதாக காண்பிக்கலாம்.

🎯 PCA மூலம் தரவுகளை எளிதாக அணுகலாம்!

👉 உயர் பரிமாண தரவுகளை 2D அல்லது 3D-ல் மாற்றி படங்கள், விளக்கப்படங்கள் மூலம் எளிதாக காண்பிக்கலாம்.

👉 பழி (Noise) நீக்குதல் மற்றும் முக்கிய அம்சங்களை மட்டும் பாதுகாக்க இது உதவுகிறது.

👉 செயல்திறன் (Efficiency) அதிகரித்து கணக்கீட்டினை வேகமாக செய்ய உதவுகிறது.

🚀 PCA-வை பயன்படுத்துவதன் மூலம் தரவுகளை அர்த்தமுள்ள மற்றும் பயன்பாடுள்ள முறையில் குறைத்துப் பயன்படுத்தலாம்!

12. MACHINE LEARNING ALGORITHMS IN TAMIL | AdaBoost (Adaptive Boosting)

📌 AdaBoost (Adaptive Boosting) – ஒரு எளிய விளக்கம்

AdaBoost என்பது பல பலவீனமான வகைப்படுத்தி (Weak Classifiers) முறைமைகளை ஒருங்கிணைத்து ஒரு சக்திவாய்ந்த வகைப்படுத்தியாக (Strong Classifier) உருவாக்கும் ஒரு Ensemble Learning முறையாகும்.

🔹 இதன் முக்கியத்துவம் என்ன?

தவறாக வகைப்படுத்தப்பட்ட தரவுகளுக்கு அதிக முக்கியத்துவம் அளிக்கிறது.

ஒரு மென்பான தரவுத்தொகுப்பை முறையாக கற்றுக்கொள்ள உதவுகிறது.

ஒவ்வொரு முறைமையும் (Iteration) முன்னதாக உள்ள பிழைகளை திருத்தி மேம்படுத்துகிறது.

🎯 AdaBoost செயல்முறை – ஒரு எளிய விளக்கம்

✅ 1. துவக்க பயிற்சி (Initialize Training):

தரவுத்தொகுப்பில் உள்ள ஒவ்வொரு பதிவுக்கும் ஒரு ஒரே நிறை (Equal Weight) வழங்கப்படும்.

✅ 2. பலவீனமான வகைப்படுத்தி (Weak Classifier) உருவாக்கம்:

முதலில் ஒரு எளிய Decision Tree அல்லது Logistic Regression போன்ற ஒரு தவறுகள் அதிகம் உள்ள வகைப்படுத்தியை உருவாக்கும்.

✅ 3. பிழைகளை கணக்கீடு செய்தல் (Calculate Errors):

இந்த வகைப்படுத்தி தவறாக வகைப்படுத்திய தரவுகளுக்கு அதிக நிறை (Higher Weight) வழங்கப்படும்.

✅ 4. புதிய வகைப்படுத்தி உருவாக்கம் (Train Another Classifier):

புதிய Decision Tree, முந்தைய தவறுகளை திருத்த முயலும்.

இந்த முறை பல முறை செய்யப்படும் (Iterations continue).

✅ 5. இறுதி முடிவு (Final Prediction):

பல Decision Trees-இன் முடிவுகளை வாக்கெடுப்பு (Weighted Voting) மூலம் ஒருங்கிணைத்து ஒரு தீவிரமான (Strong) வகைப்படுத்தியை உருவாக்கும்.

🚀 AdaBoost – ஒரு உண்மையான பயன்பாடு

📌 ஊர் நெரிசல் (Traffic Congestion) கணிப்பு

வாகன எண்ணிக்கை, காலநிலை, சாலை நிலைமைகள் ஆகியவற்றின் அடிப்படையில் ஒரு பகுதி அதிக நெரிசலாக இருக்குமா இல்லையா என்பதை கணிக்கலாம்.

📌 நிதி மோசடி கண்டறிதல் (Fraud Detection)

வங்கிகளின் பரிவர்த்தனை தரவுகளை வைத்து மோசடி செயல்பாடுகளை AdaBoost மூலம் கணிக்கலாம்.

📌 முகம் அடையாளம் காணும் கணினி (Face Recognition Systems)

புகைப்படத்திலுள்ள முக்கிய அம்சங்களை AdaBoost மூலம் வகைப்படுத்தி முகத்தை சரியாக அடையாளம் காணலாம்.

🔎 AdaBoost-ன் சிறப்பு என்ன?

✔ தகவலை துல்லியமாக கற்றுக்கொள்ள முடியும்.

✔ தவறுகளை திருத்தி தன்னை மேம்படுத்தும் திறன் கொண்டது.

✔ அதிக அளவிலான தரவுகளை எளிதாக கையாள முடியும்.

👉 AdaBoost-ஐ பயன்படுத்துவதன் மூலம் AI முறைமைகள் இன்னும் புத்திசாலியாக முடிவெடுக்க உதவ முடியும்! 🚀

AdaBoost (அடாபூஸ்ட்) முறையைப் பயன்படுத்தி, ஸ்பாம் கண்டறியும் அமைப்புகள் தங்களின் வகைப்புக் கூடுதல் துல்லியத்தை அதிகரிக்கலாம். இது குறிப்பாக குறை கூறக்கூடிய மின்னஞ்சல்களை (spam) அடையாளம் காண அதிக கவனம் செலுத்தும். இது அனுபவமுள்ள பாதுகாப்பு அதிகாரி தனது முந்தைய தவறுகளிலிருந்து கற்றுக்கொண்டு அபாயங்களை மிகச் சரியாக கண்டறிவதைப் போன்றது. 🚀

13. MACHINE LEARNING ALGORITHMS IN TAMIL | Long Short-Term Memory Networks (LSTM)

Long Short-Term Memory Networks (LSTM) என்பது மீளுறுப்பு நரம்பியல் நெட்வொர்க்கின் (Recurrent Neural Network – RNN) ஒரு சிறப்பு வகையாகும். இது தொடர்ச்சியான தரவுகளில் இருந்து பயிலவும், நீண்ட கால நினைவுகளைத் தக்கவைக்கவும் உருவாக்கப்பட்டதால், நேர்முறை முன்னறிவிப்பு (Time Series Forecasting), இயற்கை மொழி செயலாக்கம் (Natural Language Processing), மற்றும் பேச்சு அடையாளம் காணுதல் (Speech Recognition) போன்ற பணிகளுக்கு சிறப்பாக பொருந்துகிறது.

உதாரணம்: உரை தரவின் உணர்வுச் செயலாய்வு (Sentiment Analysis) மூலம் LSTM எப்படி பயன்படுத்தப்படுகிறது?

தரவுகளை சேகரித்தல்: எழுத்து மாதிரிகள் அடங்கிய குறிச்சொல்லிடப்பட்ட (labeled) தரவுத்தொகுப்பை திரட்டுதல் (எ.கா., நேர்மறை அல்லது எதிர்மறை என வகைப்படுத்தப்பட்ட திரைப்பட விமர்சனங்கள்).

தரவுகளை முன்னேற்பாடு செய்தல்: வாக்கியங்களை குறிச்சொல்லாக (Tokenizing) பிரித்து, அவற்றை எண்ணிய வடிவமாக மாற்றுதல்.

LSTM மாதிரியை உருவாக்குதல்: பொருத்தமான கட்டமைப்புடன் LSTM மாதிரியை ஆரம்பித்தல் (அணுக்களின் எண்ணிக்கை, கண்காணிப்பு முறை, செயல்பாட்டு செயல்பாடுகள் போன்றவை குறிப்பிடப்படும்).

பயிற்சி செய்தல்: உரை வரிசைகளை மாதிரிக்கு வழங்கி, முன்னறிவிக்க பயிற்சி செய்தல்.

பயிற்சி முன்னேற்றத்தை கண்காணித்தல்: சரிசெய்ய வேண்டிய அளவுருக்களை (Hyperparameters) மாற்றி, முன்னேற்றம் கண்காணிப்பதற்காக ஒரு சரிபார்ப்பு தொகுப்பில் (Validation Set) மதிப்பீடு செய்தல்.

மாதிரி மதிப்பீடு செய்தல்: தனியே ஒரு சோதனைத் தரவுத்தொகுப்பில் செயல்பாட்டுத் தரங்களை (Accuracy, Precision, Recall) மதிப்பீடு செய்து உணர்வுச் செயலாய்வின் திறனை பரிசோதித்தல்.

LSTM பயன்படுத்துவதன் மூலம், உரையின் உணர்வுத் தன்மை (Sentiment) மிகச்சரியாக பகுப்பாய்வு செய்யப்படுகிறது, இது விமர்சனங்கள், சமூக ஊடகக் கருத்துக்கள் மற்றும் வாடிக்கையாளர் மதிப்பீடுகள் போன்றவற்றை புரிந்துகொள்வதில் உதவுகிறது! 🚀

14. MACHINE LEARNING ALGORITHMS IN TAMIL | LightGBM

LightGBM எங்கு சிறப்பாக செயல்படுகிறது?

தேடல் எஞ்சின்களில் தரவரிசை கணிப்பு:

இணையத் தேடல்களில், ஒரு பயனரின் வினவலுக்குச் (query) பொருத்தமான முடிவுகளை முன்னுரிமை அடிப்படையில் தரவரிசைப்படுத்த LightGBM பயன்படுத்தப்படுகிறது.

பெரிய அளவிலான தரவுகளை திறமையாகக் கையாளும் திறன் காரணமாக, இது வேகமாகவும் சிறந்த முன்னறிவிப்பு திறனுடன் செயல்படுகிறது.

நிதி சேவைகள் (Financial Services):

வாடிக்கையாளர் வெளியேறல் (Churn Prediction): வாடிக்கையாளர்கள் சேவையை தொடருமா அல்லது விலகுமா என்பதைக் கணிக்க LightGBM உதவுகிறது.

கடன் அபாய மதிப்பீடு (Credit Risk Prediction): கடனுக்குத் தகுதியானவர்களை கண்டறிய, வரலாற்று தரவுகளின் அடிப்படையில் LightGBM வாடிக்கையாளர்களின் செலுத்தும் திறனை மதிப்பீடு செய்ய உதவுகிறது.

🔹 ஏன் LightGBM?

✔ பெரிய அளவிலான தரவுகளை வேகமாக செயலாக்கும் திறன்

✔ குறைந்த நினைவக (RAM) பயன்பாடு

✔ அதிகச் செயல்திறன் மற்றும் குறைந்த செலவு

எனவே, பெரிய தரவுத்தொகுப்புகளுடன் வேகமாகவும் துல்லியமாகவும் செயல்பட வேண்டிய பணிகளில் LightGBM மிகச் சிறந்த தேர்வாக விளங்குகிறது! 🚀

LightGBM அல்காரிதத்தை பயன்படுத்தி வாடிக்கையாளர் வெளியேறல் (Churn) கணிப்பது எப்படி?

பயன்பாட்டு எடுத்துக்காட்டு: சந்தா சேவையில் வாடிக்கையாளர் வெளியேறல் கணிப்பு

1️⃣    தரவைச் சேகரிப்பு:

வாடிக்கையாளர்களின் வயது, சந்தா வகை, பயன்பாட்டு அடிக்கடி, கட்டண வரலாறு போன்ற அம்சங்களை (features) சேகரிக்கவும்.

2️⃣    வெளியேறல் காரணிகளை மதிப்பீடு செய்யவும்:

பயன்பாட்டு அளவு, பயனர் ஈடுபாடு (engagement metrics), மற்றும் திருப்தி நிலை போன்ற காரணிகள் வெளியேறலுக்கு முக்கியமானவை என்பதை ஆய்வு செய்யவும்.

3️⃣    தரவு முன்மாதிரியாக்கம் (Preprocessing):

பிழையான / குறைவான தரவை நிரப்புதல்.

உரையால் இருப்பவற்றை எண் மதிப்புகளாக மாற்றுதல் (encoding categorical variables).

பயிற்சி (training) மற்றும் சோதனை (test) தொகுப்புகளாகப் பிரித்தல்.

4️⃣    மாதிரியை பயிற்சி செய்யவும்:

LightGBM மாதிரியை பயிற்சி தொகுப்பில் (training dataset) பயிற்சி செய்து, வெளியேறலுக்கான முக்கிய அம்சங்களை அறிந்து கொள்ள செய்யவும்.

5️⃣    மாதிரியை சோதனை செய்யவும்:

சோதனை தொகுப்பில் மாதிரியின் செயல்திறனை மதிப்பீடு செய்யவும்.

அளவுகோல்கள் (Metrics): துல்லியம் (Accuracy), துல்லியத் தன்மை (Precision), மீட்பு விகிதம் (Recall), மற்றும் F1 மதிப்பெண் (F1 Score) ஆகியவற்றை கணிக்கவும்.

6️⃣    வழியளிப்பு மற்றும் கணிப்பு:

புதிய வாடிக்கையாளர்களுக்கான churn சாத்தியத்தை கணிக்கவும்.

வெளியேறுவதற்கான சாத்தியப்பாடு அதிகமானவர்களை (1) மற்றும் குறைந்தவர்களை (0) என வகைப்படுத்தவும்.

LightGBM எதற்கு சிறந்தது?

✔ பெரிய அளவிலான தரவுகளை வேகமாக செயல்படுத்தும் திறன்

✔ சிறப்பான துல்லியத்தன்மை

✔ குறைந்த மெமரி பயன்பாடு

👉 இதன்மூலம் நிறுவனங்கள் வாடிக்கையாளர்களை முறையாக அடையாளம் கண்டு, வெளியேறலை குறைக்கும் முன்னெச்சரிக்கை நடவடிக்கைகளை எடுக்க முடியும்! 🔍

15. MACHINE LEARNING ALGORITHMS IN TAMIL | XGBoost:

XGBoost – பலவீனக் கற்றலாளர்களை (Weak Learners) மேம்படுத்தும் சக்திவாய்ந்த அல்காரிதம்

XGBoost (Extreme Gradient Boosting) ஒரு மேம்பட்ட எண்ணிக்கை மரம் அடிப்படையிலான (tree-based) எழுச்சி வளர்ப்பு (boosting) அல்காரிதம் ஆகும். இது ஒரு தொடர்ச்சியான பலவீனக் கற்றலாளர்களை உருவாக்கி, ஒவ்வொரு புதிய கற்றலாளரும் முந்தையவை செய்த பிழைகளை சரிசெய்ய முயற்சிக்கிறது.

XGBoost எவ்வாறு செயல்படுகிறது?

1️⃣    தரவைச் சேகரித்தல் மற்றும் முன்னமைத்தல் (Preprocessing):

அம்சங்களை (features) தேர்வு செய்தல்

குறைவான / பிழையான தரவை நிரப்புதல்

பயிற்சி (training) மற்றும் சோதனை (testing) தொகுப்புகளாகப் பிரித்தல்

2️⃣    முதன்மையான முடிவெடுக்கும் மரம் (Decision Tree) உருவாக்குதல்:

முதலில் ஒரு அடிப்படை முடிவெடுக்கும் மரம் உருவாக்கப்படுகிறது.

இது ஒரு எளிய பலவீனக் கற்றலாளர் (weak learner) ஆக செயல்படும்.

3️⃣    பிழைகளை சரிசெய்தல் (Error Correction):

ஒவ்வொரு புதிய மரமும் முந்தைய மரத்தின் பிழைகளை (errors) சரிசெய்ய பயன்படும்.

இது தோன்றல் இறங்குதல் (Gradient Descent) மூலம் செயல்படுகிறது.

4️⃣    எல்லா மரங்களின் முடிவுகளையும் சேர்த்தல்:

பல மரங்களின் முடிவுகளை சேர்த்து, ஒரு சக்திவாய்ந்த மாதிரி உருவாக்கப்படுகிறது.

5️⃣    மாதிரியை சோதித்து மதிப்பீடு செய்தல்:

அளவுகோல்கள் (Metrics): துல்லியத் தன்மை (Precision), மீட்பு விகிதம் (Recall), F1 Score, RMSE ஆகியவை கணிக்கப்படும்.

XGBoost எதற்காக சிறந்தது?

✔ வேகமான செயல்பாடு: GPU மற்றும் மெமரி செயல்படுத்துதலால் மிக விரைவாக செயல்படும்.

✔ குறுகிய மெமரி பயன்பாடு: பெரிய தரவுகளையும் சமாளிக்கும் திறன்.

✔ அதிக துல்லியத் தன்மை: பிற வளர்ப்பு முறைமைகளைவிட சிறப்பான முடிவுகளை வழங்கும்.

எடுத்துக்காட்டு: வங்கி கடன் ஒப்புதல் (Loan Approval) கணிப்பு

🔹 வாடிக்கையாளர் வருமானம், கடன் அளவு, சொத்து மதிப்பு போன்ற அம்சங்களைப் பயன்படுத்தி கடன் ஒப்புதல் சாத்தியத்தை கணிக்கலாம்.

🔹 XGBoost முறை கடன் திருப்பிச் செலுத்தும் மற்றும் திருப்பிச் செலுத்த முடியாத நபர்களை துல்லியமாக வகைப்படுத்த உதவும்.

👉 XGBoost மூலமாக தொழில்துறைகளில் விரைவான மற்றும் துல்லியமான கணிப்புகளை செய்ய முடியும்! 📊🚀

XGBoost – நிதி மோசடி கண்டறிதல் (Fraud Detection) க்கான செயல்முறை

XGBoost அல்காரிதம் நிதி பரிவர்த்தனைகளில் மோசடியை (Fraud Detection) கண்டுபிடிக்க மிகவும் பயனுள்ளதாக இருக்கிறது. இது பெரிய அளவிலான தரவுகளை (Large Datasets) விரைவாக பயிற்றுவித்து துல்லியமான முடிவுகளை வழங்குகிறது.

________________________________________

XGBoost மூலம் மோசடி கண்டுபிடிக்கும் செயல்முறை

1️⃣    தரவுச் சேகரிப்பு (Data Collection)

o              பரிவர்த்தனை தொகை (Transaction Amount)

o              பரிவர்த்தனை வகை (Transaction Type)

o              பயனர் இருப்பிடம் (User Location)

o              கருவி (Device Used)

o              நேர அடிப்படையிலான அம்சங்கள் (Time-Based Features)

2️⃣   மோசடி சாத்தியமான தன்மைகளை அடையாளம் காணுதல் (Fraud Pattern Identification)

o              வழக்கத்திற்கு மாறான பரிவர்த்தனை அளவு

o              சிறிது நேரத்தில் மீண்டும் மீண்டும் பரிவர்த்தனை செய்தல்

o              புதிய இடத்திலிருந்து திடீர் பரிவர்த்தனை

o              ஒரு கணக்கில் இருந்து பல்வேறு வங்கிக்கணக்குகளுக்கு பணம் பரிமாற்றம்

3️⃣   தரவின் முன்னமைப்பு (Preprocessing)

o              பிழைகள் உள்ள தரவை நிரப்புதல் (Handling Missing Values)

o              உரை மற்றும் வகைப் புள்ளிவிவரங்களை எண்களாக மாற்றுதல் (Encoding Categorical Variables)

o              தரவைக் கனமயமாக்குதல் (Feature Scaling & Normalization)

o              பயிற்சி, சரிபார்ப்பு, மற்றும் சோதனை தொகுப்புகளாக (Train-Validation-Test Split) பிரித்தல்

4️⃣   XGBoost மாதிரியை பயிற்றுவித்தல் (Training the Model)

o              பயிற்சி தொகுப்பைப் பயன்படுத்தி XGBoost மாதிரியை உருவாக்குதல்

o              ஒவ்வொரு புதுப் பரிவர்த்தனையின் மோசடி சாத்தியத்தை கணிக்க முயற்சித்தல்

5️⃣   மாதிரியை மதிப்பீடு செய்தல் (Evaluating the Model)

o              சரிபார்ப்பு தொகுப்பில் கற்றலின் செயல்பாடுகளை (Performance Metrics) கணித்தல்

o             துல்லியத்தன்மை (Accuracy)

o             மீட்பு விகிதம் (Recall) – மோசடியை சரியாக கண்டுபிடிக்க உதவும்

o             Precision – தவறாக மோசடியாக வகைப்படுத்தும் எண்ணிக்கை குறைய உதவும்

o             F1 Score – Precision & Recall இன் சமநிலை

o              ஹைப்பர்பராமீட்டர்களை (Hyperparameter Tuning) சரிசெய்தல் (Learning Rate, Maximum Depth)

6️⃣   மாதிரியை செயல்படுத்துதல் (Deployment & Real-time Monitoring)

o              பயிற்றுவிக்கப்பட்ட XGBoost மாதிரியை நிகழ்நேர பரிவர்த்தனைகள் (Real-time Transactions) மீது செயல்படுத்தல்

o              சந்தேகத்திற்கிடமான பரிவர்த்தனைகளை சோதனைக்கு (Flagging for Further Review) அனுப்புதல்

o              மாதிரியின் செயல்பாட்டை தொடர்ச்சியாக கண்காணித்து புதுப்பித்தல்

________________________________________

எடுத்துக்காட்டு (Example Scenario)

ஒரு வங்கி திடீரென ஒரு பயனரின் கணக்கிலிருந்து $10,000 பரிவர்த்தனை செய்யப்பட்டுள்ளது

✅ XGBoost ஆனது பயனரின் பழைய பரிவர்த்தனை முறைகளை மதிப்பீடு செய்து, இது ஒரு வழக்கத்திற்கு மாறான பரிவர்த்தனை என்பதை கண்டுபிடிக்கும்.

✅ இது மோசடி சாத்தியம் அதிகம் (High Fraud Probability) எனக் குறிக்கிறது.

✅ வங்கி பயனருக்கு ஒரு எஸ்எம்எஸ் (SMS) அல்லது ஒரு அழைப்பு (Call) அனுப்பி உறுதிப்படுத்தும்.

✅ பயனர் உறுதிப்படுத்தாவிட்டால், பரிவர்த்தனை தற்காலிகமாக நிறுத்தப்படும்.

________________________________________

எதற்காக XGBoost சிறந்த தேர்வு?

✔ அதிவேக பயிற்சி (Fast Training) – பெரிய தரவுகளை விரைவாக கையாளும்

✔ துல்லியமான முடிவுகள் (High Accuracy) – குறைந்த தவறுகள் (False Positives)

✔ நிகழ்நேர செயல்பாடு (Real-time Predictions) – பரிவர்த்தனைகளை உடனடியாக மதிப்பீடு செய்யும்

📌 XGBoost மூலம் நிதி நிறுவனங்கள் மோசடிகளை துல்லியமாக கண்டறிந்து நஷ்டங்களை குறைக்க முடியும்! 🚀

Share the knowledge