Machine Learning is the science (and art) of programming computers so they can

learn from data.





उदाहरण के लिए, आपका स्पैम फ़िल्टर एक मशीन लर्निंग प्रोग्राम है जो झंडा लगाना सीख सकता है!
स्पैम दिए गए स्पैम ईमेल के उदाहरण (जैसे, उपयोगकर्ताओं द्वारा चिह्नित) और नियमित के उदाहरण
     nonspam जिसे "हैम" भी कहा जाता है) ईमेल। सिस्टम सीखने के लिए जिन उदाहरणों का उपयोग करता है वे हैं
प्रशिक्षण सेट कहा जाता है। प्रत्येक प्रशिक्षण उदाहरण को एक प्रशिक्षण उदाहरण (या नमूना) कहा जाता है।
इस मामले में, कार्य टी नए ईमेल के लिए स्पैम को फ़्लैग करने के लिए है, अनुभव ई प्रशिक्षण है
डेटा, और प्रदर्शन माप पी को परिभाषित करने की आवश्यकता है; उदाहरण के लिए, आप उपयोग कर सकते हैं
सही ढंग से वर्गीकृत ईमेल का अनुपात। इस विशेष प्रदर्शन माप को कहा जाता है
सटीकता और इसे अक्सर वर्गीकरण कार्यों में उपयोग किया जाता है।
यदि आप सिर्फ विकिपीडिया की एक प्रति डाउनलोड करते हैं, तो आपके कंप्यूटर में बहुत अधिक डेटा है, लेकिन यह है
किसी भी कार्य में अचानक बेहतर नहीं। इस प्रकार, यह मशीन लर्निंग नहीं है।



मशीन लर्निंग का उपयोग क्यों करें?

    विचार करें कि आप पारंपरिक प्रोग्रामिंग तकनीक का उपयोग करके एक स्पैम फ़िल्टर कैसे लिखेंगे?

सबसे पहले आप देखेंगे कि आम तौर पर स्पैम क्या दिखता है। आप देख सकते हैं कि
कुछ शब्द या वाक्यांश (जैसे "4U," "क्रेडिट कार्ड," "निःशुल्क," और "अद्भुत") होते हैं
विषय में बहुत ऊपर आते हैं। शायद आप भी कुछ अन्य पैटर्न नोटिस करेंगे

प्रेषक का नाम, ईमेल का मुख्य भाग, और इसी तरह



आपके द्वारा देखे गए प्रत्येक पैटर्न के लिए आप एक डिटेक्टिंग एल्गोरिदम लिखेंगे,
और यदि आपका नंबर इन पैटर्नों का है तो आपका प्रोग्राम ईमेल को स्पैम के रूप में चिह्नित करेगा

पता चला।

आप अपने कार्यक्रम का परीक्षण करेंगे, और चरण 1 और 2 को तब तक दोहराएंगे जब तक कि यह पर्याप्त न हो
चूंकि समस्या तुच्छ नहीं है, इसलिए आपका programme संभवतः complex  की लंबी सूची बन जाएगा

complex rules- बनाए रखने के लिए बहुत कठिन।


इसके विपरीत, मशीन लर्निंग तकनीकों पर आधारित एक स्पैम फिल्टर स्वचालित रूप से सीखता है
कौन से शब्द और वाक्यांश असामान्य रूप से frequent  का पता लगाकर स्पैम के अच्छे detection हैं

हैम उदाहरणों की तुलना में स्पैम उदाहरणों में शब्दों के क्वेंट पैटर्न!


इसके अलावा, अगर स्पैमर नोटिस करते हैं कि उनके सभी ईमेल "4U" अवरुद्ध हैं, तो वे
इसके बजाय "यू के लिए" लिखना शुरू कर सकते हैं। पारंपरिक प्रोग्रामिंग का उपयोग कर एक स्पैम फ़िल्टर
तकनीकों को "यू" ईमेलों को फ़्लैग करने के लिए अद्यतन करने की आवश्यकता होगी। यदि स्पैमर काम करते हैं तो

अपने स्पैम फ़िल्टर के आसपास, आपको हमेशा नए नियम लिखते रहना होगा।




इसके विपरीत, मशीन लर्निंग तकनीक पर आधारित एक स्पैम फिल्टर स्वचालित रूप से नोटिस करता है कि "फॉर यू" असामान्य रूप से उपयोगकर्ताओं द्वारा चिह्नित किए गए स्पैम में अक्सर हो गया है, और यह शुरू होता है

आपके हस्तक्षेप के बिना उन्हें ध्वजांकित करना


एक अन्य क्षेत्र जहां मशीन लर्निंग चमकता है वह उन समस्याओं के लिए है जो या तो पारंपरिक दृष्टिकोणों के लिए बहुत जटिल हैं या कोई ज्ञात एल्गोरिथ्म नहीं है। उदाहरण के लिए, विचार करें
भाषण पहचान: कहते हैं कि आप सरल शुरू करना चाहते हैं और एक कार्यक्रम लिखने में सक्षम हैं
"एक" और "दो" शब्दों को समझना आप देख सकते हैं कि शब्द "दो" शुरू होता है
एक उच्च-पिच ध्वनि ("टी") के साथ, इसलिए आप एक एल्गोरिदम को हार्डकोड कर सकते हैं जो मापता है
उच्च पिच ध्वनि की तीव्रता और लोगों और दो लोगों को अलग करने के लिए इसका उपयोग करें। जाहिर है यह

तकनीक हजारों शब्दों के पैमाने पर नहीं होगी जो लाखों लोगों द्वारा बोली जाती है!

शोर के माहौल में और दर्जनों भाषाओं में लोग। सबसे अच्छा समाधान (कम से कम
आज) एक एल्गोरिथ्म लिखना है जो अपने आप सीखता है, कई उदाहरण रिकॉर्डिंग दिए गए हैं

प्रत्येक शब्द के लिए


अंत में, मशीन लर्निंग इंसानों को एमएल एल्गोरिदम सीखने में मदद कर सकता है
यह देखने के लिए कि उन्होंने क्या सीखा है (हालांकि कुछ एल्गोरिदम के लिए यह हो सकता है
मुश्किल)। उदाहरण के लिए, एक बार स्पैम फ़िल्टर को पर्याप्त स्पैम पर प्रशिक्षित किया गया हो, तो यह हो सकता है
आसानी से शब्दों की सूची और शब्दों के संयोजन को प्रकट करने के लिए निरीक्षण किया जा सकता है कि यह

विश्वास स्पैम के सर्वश्रेष्ठ भविष्यवक्ता हैं। कभी-कभी यह असंबद्ध सहसंबंध या नए रुझानों को प्रकट करेगा, और जिससे समस्या की बेहतर समझ पैदा होगी।






ऐसी समस्याएं जिनके लिए मौजूदा समाधानों के लिए बहुत अधिक हाथ-ट्यूनिंग या लंबी सूची की आवश्यकता होती है
नियम: एक मशीन लर्निंग एल्गोरिदम अक्सर कोड को सरल कर सकता है और bet algorithm कर सकता है

टेर।


जटिल समस्याएं जिनके लिए पारंपरिक का उपयोग करने का कोई अच्छा समाधान नहीं है

दृष्टिकोण: सबसे अच्छा मशीन लर्निंग तकनीक एक समाधान पा सकते हैं!



उतार-चढ़ाव वाले वातावरण: एक मशीन लर्निंग सिस्टम नए डेटा के लिए अनुकूल हो सकता है।

जटिल समस्याओं और बड़ी मात्रा में डेटा के बारे में जानकारी प्राप्त करना!



THANK YOU.....