Walton Electronics Co., Ltd.
저희에게 연락하십시오

담당자 : Walton-cara

전화 번호 : 15986872308

Free call

기계학습은 다 단계를 요구합니다

July 18, 2022

도입

활용하는 기계 학습 (ML)는 다단계 프로세스입니다. 그것은 모델을 선택하고, 특정한 작업을 위해 기차로 가고, 시험 자료로 그것을 유효하게 하고 그리고 나서 생산에서 모델을 배치하고 모니터링하는 것을 포함합니다. 여기에서, 우리는 당신을 ML에 도입하기 위해 이러한 단계를 논의하고 그들을 분류할 것입니다. ML은 명시적 지침 없이 배우고 나아질 수 있는 시스템을 언급합니다. 이러한 시스템은 특정 임무 또는 기능을 수행하기 위해 데이터로부터 배웁니다. 몇몇의 경우에 배우기. 또는 더 특정 트레이닝이 부정확한 출력이 정확한 출력을 향하여 그것을 슬쩍 찌르기 위해 모델을 조정하는 결과를 초래하는 통제받은 방식에서 발생합니다. 다른 경우에, 시스템이 이전에 미지 패턴을 밝히기 위해 데이터를 구성한 곳에서 자율 학습은 발생합니다. 대부분의 ML 모델들은 (자율 학습 대 관리된) 이러한 2 패러다임을 따릅니다. 지금 모델에 의해 의도되는 철저히 조사하고 어떻게 데이터가 기계 레아마닝을 위해 연료가 되는 지를 그리고 나서 연구하도록 합시다. 기계학습 모델 모델이 기계 학습을 위한 솔루션의 추출입니다. 모델은 architecture。를 규정합니다 한때 훈련됩니다, 실행이 됩니다. 그러므로, 우리는 모델들을 배치하지 않습니다. 우리는 데이터로부터 훈련된 모델들의 실행을 배치합니다 (다음 섹션에 이것에서 더 ). 그래서 데이터 외에 모델들은 ML 솔루션 (Figure1)의 트레이닝 똑같은 예를 더합니다. 번역은 요구됩니다. 예를 들면, 텍스트 데이터를 깊은 학습망에 공급하는 것 일반적으로 사용될 수 있는 고도 치수 벡터 주어진 다양한 단어인 수치상 형태 안으로 인코딩하는 단어를 요구합니다. 유사하게, 출력은 수치상 형태 뒤쪽에서 텍스트 형식으로 번역을 요구할 것입니다. 신경망 모델들, 베이시안 모델들, 회귀 모델들, 집단화 모델들과 많포함하여 ML 모델들은 많은 유형에 들어옵니다. 당신이 선택하는 모델은 가까이에 문제에 기초를 둡니다. 신경망과 관련하여, 모델들은 얕은 다중 층 네트워크에서 많은 층을 포함하는 깊은 신경망까지 이릅니다

전문화된 뉴런 (처리부)의. 깊은 신경망은 또한 당신의 대상 애플리케이션에 이용 가능한 모델들의 범위를 기반을 두게 합니다.

예를 들면 다음

●If 귀하의 어플리케이션은 이미지 이내에 대상 확인에 집중되는 후, 컨벌루셔널 신경망 (CNN)가 이상적인 모델입니다. CNN은 피부암 탐지에 적용되었고, 평균 피부과 전문의를 능가합니다.

●If 귀하의 어플리케이션은 복소 시퀀스를 예상하거나 발생시키는 것을 포함하는 후, (인간 언어 문장과 같이) 러커런트 뉴럴 네트워크 (RNN) 또는 장-단 용어 메모리 네트워크 (LSTM)가 이상적인 모델들입니다. 라이스트엠에스는 또한 자연어을 자동 번역에 적용되었습니다.

●If 귀하의 어플리케이션은 자연어로 이미지의 내용을 데스크빙 포함하는 후, CNN과 LSTM의 조합이 사용될 수 있습니다 (이미지가 CNN으로 공급되고 CNN의 출력이 단어 시퀀스를 분사하는 LSTM에 대한 입력을 대표하는 곳).

●If 귀하의 어플리케이션은 실 상을 발생시키는 것을 포함하는 후, (경관 또는 얼굴들과 같이) 생성 반대하는 네트워크 (GAN)가 예술 모델의 현재 스탯을 대표합니다. 이러한 모델들은 오늘 사용에서 더 인기있는 깊은 신경망 구조의 일부를 대표합니다. 그들이 이미지 또는 비디오 또는 음향 정보와 같은 구조화되지 않은 데이터를 받아들일 수 있기 때문에 깊은 신경망은 인기있습니다. 네트워크 이내에 레이어는 그들이 복합적인 정보를 매우 클아시프리 있게 허락하는 기능의 지배층을 건설합니다. 깊은 신경망은 문제 도메인의 광범위한 숫자 위에서 최신 기술 성능을 증명했습니다. 그러나 다른 ML 모델들과 같이, 그들의 정확도는 데이터에 의존합니다. 다음에 이 양상을 탐구하도록 합시다.

자료와 훈련

데이터는 모델 트레이닝을 통하여 ML 솔루션을 건설하는 것도 전혀 단지 운영에서, 기계 학습을 운전하지 않는 연료입니다. 깊은 신경망에 대한 훈련 데이터와 관련하여, 양과 질과 관련하여 필요한 자료를 탐구하는 것은 중요합니다. 깊은 신경망은 교육을 위해 큰 데이터량이 요구됩니다. 화상 기반 분류를 위한 한 눈대중은 1,000이지 이미지입니다

클래스마다. 그러나 대답은 모형의 복잡성과 에러에 대한 허용한도에 의존합니다. 생산 ML 해결책으로부터의 약간의 예는 데이터 셋 크기의 스펙트럼을 만듭니다. 계속 얼굴 디텍티와 인식 시스템은 450,000이지 이미지를 요구했고 챗봇이 200,000이지 질문으로 양성되었다는 질문과 답이 200만 답과 쌍을 이루었습니다. 더 작은 데이터 셋은 해결되는 문제에 기초를 두는 것으로 또한 충분할 수 있습니다. 기록된 텍스트로부터 의견의 극성을 결정하는 감정 분석 솔루션은 샘플 중의 오직 수만을 요구했습니다. 데이터 품질은 단지 양만큼 중요합니다. 심지어 큰 데이터 세트가 훈련을 요구했다고 고려해 볼 때, 잘못된 훈련 데이터의 작은 양은 저 용해 용액으로 이어질 수 있습니다. 필요한 데이터의 유형에 따라, 당신의 데이터는 세정 절차를 통과할 것입니다. 데이터 셋이 일관되고, 복제 데이터가 결핍되고, 정확하고 완성하다는 것을 이것은 보증합니다 (무효이 또는 불완전 자료가 결핍됩니다). 도구는 이 절차를 지원하기 위해 존재합니다. 편견에 대한 유효화 데이터는 자료가 편향된 ML 솔루션으로 이어지지 않는다는 것을 보증하도록 또한 중요합니다. ML 훈련은 수치형자료에 작용하고 따라서 전처리 단계가 당신의 솔루션에 따라 요구될 수 있습니다. 예를 들면, 당신의 데이터가 자연어이면, 그것은 처음으로 처리하기 위한 수치상 형태로 번역되어야 합니다. 이미지는 일관성을 위해 선처리될 수 있습니다. 예를 들면, 깊은 신경망으로 공급된 이미지는 리사이징되고 (다른 작전 중에) 소음을 제거하기 위해 매끄러워질 것입니다. 가장 큰 ML의 문제 중 하나는 당신의 ML 해결책을 훈련시키기 위해 데이터 셋 인수하고 있습니다. 그것이 존재하고 개별적 공로를 필요하지 않기 때문에 이것은 당신의 문제에 따라 가장 큰 노력일 수 있었습니다

사로잡습니다. 마침내, 데이터 셋은 훈련 데이터와 시험 자료 사이에 분할되어야 합니다. 트레이닝 부분은 모델을 훈련시키는데 사용되고 한때 훈련됩니다, 시험 자료가 해결책의 정확도를 유효하게 하는데 사용됩니다

 

우리와 연락하기

당신의 메시지에 들어가십시오