ಮೊದಲು ದಾರಿ ಗುರುತಿಸೋಣ
ಲೇಬಲ್ ಇರುವ data ಮತ್ತು ಇಲ್ಲದ data ಆಧರಿಸಿ ಯಾವ learning ದಾರಿ ಯಾವಾಗ ಸೂಕ್ತ ಅನ್ನೋದನ್ನು ಮೂಲವಾಗಿ ತಿಳಿದುಕೊಳ್ಳುತ್ತೀರಿ.
ಯಂತ್ರ ಕಲಿಕೆಯ ಎರಡು ದಾರಿ: ಲೇಬಲ್ ಇರುವ data ಇದ್ದರೆ supervised, ಇಲ್ಲದ data ಇದ್ದರೆ unsupervised — ಯಾವ ಸಂದರ್ಭದಲ್ಲಿ ಯಾವ learning ದಾರಿ ಸೂಕ್ತ ಅನ್ನೋದು ಸ್ಪಷ್ಟವಾಗುತ್ತದೆ. By the end, you'll know: labeled data ಆಯ್ಕೆ, unlabeled data ಬಳಕೆ, problem-fit ತೀರ್ಮಾನ. ಯಂತ್ರ ಕಲಿಕೆಯಲ್ಲಿ ಮೊದಲ ಪ್ರಶ್ನೆ model ಏನು ಮಾಡಬೇಕು ಅನ್ನೋದಲ್ಲ. data ಜೊತೆ ಸರಿಯಾದ ಉತ್ತರ already ಇದೆಯಾ ಇಲ್ಲವಾ ಅನ್ನೋದ್ರಲ್ಲೇ. ಈ ಒಂದೇ check ನಿಂದ supervised ಮತ್ತು unsupervised learning ಬೇರ್ಪಡುತ್ತವೆ. ನಿಮ್ಮ ಬಳಿ ಪ್ರತಿಯೊಂದು input ಗೆ known output ಇದ್ದರೆ, ನೀವು supervised ದಾರಿಗೆ ಹೋಗ್ತೀರಿ. ಉದಾಹರಣೆಗೆ, email ಗೆ spam ಅಥವಾ not spam ಅನ್ನೋ label ಇದ್ದರೆ, model ಗೆ input-output mapping ಕಲಿಸುವ ಕೆಲಸ ಶುರುವಾಗುತ್ತದೆ. ಉತ್ತರ ಇಲ್ಲದ data ಬಂದರೆ, ಅದೇ problem ಬೇರೆ ದಾರಿಗೆ ತಿರುಗುತ್ತದೆ. ಇಲ್ಲಿ ಮುಖ್ಯ point ಏನಂದ್ರೆ, machine learning ಅನ್ನೋದು ಒಂದೇ ತಂತ್ರ ಅಲ್ಲ. data ಯಲ್ಲಿ labels ಇದ್ದರೆ prediction ಕಡೆ ಹೋಗಬಹುದು. labels ಇಲ್ಲದಿದ್ದರೆ structure ಹುಡುಕಬೇಕು. Professional perspective ನಲ್ಲಿ ಇದು important, ಏಕೆಂದರೆ problem ಗೆ ತಪ್ಪು ದಾರಿ ಆಯ್ಕೆ ಮಾಡಿದ್ರೆ objective ಕೂಡ ತಪ್ಪಾಗಿ set ಆಗುತ್ತದೆ. ಹಾಗಾದರೆ ನೀವು data ನೋಡಿ ಏನು predict ಮಾಡ್ತೀರಿ? ಉತ್ತರ available ಇದೆಯಾ, ಅಥವಾ data itself ಮಾತಾಡಬೇಕು ಅಷ್ಟೇನಾ? ಈ distinction clear ಆದ್ಮೇಲೆ, ಮುಂದೆ ಯಾವ model family ನೋಡಬೇಕು ಅನ್ನೋ decision ತುಂಬಾ clean ಆಗುತ್ತದೆ.
ಲೇಬಲ್ ಇದ್ದರೆ ಕಲಿಕೆ
labeled data ಬಳಸಿ supervised learning ಹೇಗೆ input-output mapping ಕಲಿಯುತ್ತದೆ ಮತ್ತು prediction ಗೆ ಹೇಗೆ ಉಪಯೋಗವಾಗುತ್ತದೆ ಅನ್ನೋದನ್ನು ತಿಳಿದುಕೊಳ್ಳುತ್ತೀರಿ.
ಯಂತ್ರ ಕಲಿಕೆಯಲ್ಲಿ ಮೊದಲ ಪ್ರಶ್ನೆ model ಏನು ಮಾಡಬೇಕು ಅನ್ನೋದಲ್ಲ. data ಜೊತೆ ಸರಿಯಾದ ಉತ್ತರ already ಇದೆಯಾ ಇಲ್ಲವಾ ಅನ್ನೋದ್ರಲ್ಲೇ. ಈ ಒಂದೇ check ನಿಂದ supervised ಮತ್ತು unsupervised learning ಬೇರ್ಪಡುತ್ತವೆ. ನಿಮ್ಮ ಬಳಿ ಪ್ರತಿಯೊಂದು input ಗೆ known output ಇದ್ದರೆ, ನೀವು supervised ದಾರಿಗೆ ಹೋಗ್ತೀರಿ. ಉದಾಹರಣೆಗೆ, email ಗೆ spam ಅಥವಾ not spam ಅನ್ನೋ label ಇದ್ದರೆ, model ಗೆ input-output mapping ಕಲಿಸುವ ಕೆಲಸ ಶುರುವಾಗುತ್ತದೆ. ಉತ್ತರ ಇಲ್ಲದ data ಬಂದರೆ, ಅದೇ problem ಬೇರೆ ದಾರಿಗೆ ತಿರುಗುತ್ತದೆ. ಇಲ್ಲಿ ಮುಖ್ಯ point ಏನಂದ್ರೆ, machine learning ಅನ್ನೋದು ಒಂದೇ ತಂತ್ರ ಅಲ್ಲ. data ಯಲ್ಲಿ labels ಇದ್ದರೆ prediction ಕಡೆ ಹೋಗಬಹುದು. labels ಇಲ್ಲದಿದ್ದರೆ structure ಹುಡುಕಬೇಕು. Professional perspective ನಲ್ಲಿ ಇದು important, ಏಕೆಂದರೆ problem ಗೆ ತಪ್ಪು ದಾರಿ ಆಯ್ಕೆ ಮಾಡಿದ್ರೆ objective ಕೂಡ ತಪ್ಪಾಗಿ set ಆಗುತ್ತದೆ. ಹಾಗಾದರೆ ನೀವು data ನೋಡಿ ಏನು predict ಮಾಡ್ತೀರಿ? ಉತ್ತರ available ಇದೆಯಾ, ಅಥವಾ data itself ಮಾತಾಡಬೇಕು ಅಷ್ಟೇನಾ? ಈ distinction clear ಆದ್ಮೇಲೆ, ಮುಂದೆ ಯಾವ model family ನೋಡಬೇಕು ಅನ್ನೋ decision ತುಂಬಾ clean ಆಗುತ್ತದೆ. ನೀವು ಮುಂದಿನ ಬಾರಿ supervised problem ನೋಡಿದಾಗ, first question: correct answer data ಜೊತೆ ಇದೆಯಾ? second question: ಹೊಸ data ಮೇಲೆ predict ಮಾಡೋದು goal ಇದೆಯಾ? ಈ ಎರಡು yes ಆಗಿದ್ರೆ, ನೀವು ಸರಿಯಾದ ದಾರಿಯಲ್ಲಿದ್ದೀರಿ.
ಮರೆಯಾದ pattern ಹುಡುಕು
label ಇಲ್ಲದ data ಯಲ್ಲಿ grouping, hidden structure, ಮತ್ತು patterns ಕಂಡುಹಿಡಿಯುವ unsupervised learning ನ ಸ್ವಭಾವವನ್ನು ಅರಿತುಕೊಳ್ಳುತ್ತೀರಿ.
ಎರಡರ ವ್ಯತ್ಯಾಸ ಸ್ಪಷ್ಟ
supervised ಮತ್ತು unsupervised learning ಅನ್ನು labels, objective, ಮತ್ತು evaluation ದೃಷ್ಟಿಯಿಂದ ನೇರವಾಗಿ ಹೋಲಿಸಿ ಸ್ಪಷ್ಟವಾಗಿ ಬೇರ್ಪಡಿಸಿಕೊಳ್ಳುತ್ತೀರಿ.