2024/10 7

[기초] 데이터 사이언스 응용_word vocabulary

5개의 문장이 있다고 하자.이때 5개의 모든 문장을 vocabulary로 만들거다. 대신 중복은 없어야한다. 이를 직접 코드를 짜줄 수도 있지만 이미 구현된 라이브러리가 있다.from tensorflow.keras.preprocessing.text import Tokenizertokenizer = Tokenizer()tokenizer.fit_on_texts(preprocessed_headline)vocab_size = len(tokenizer.word_index) + 1print('단어 집합의 크기 : %d' % vocab_size)  이에 대한 자세한 GPT의 설명!1. 사전(vocabulary) 변수:tokenizer.word_index:이 변수는 텍스트에서 발견된 각 단어와 그 단어에 매핑된 고유한..

공부/파이썬 2024.10.24

[기초] 데이터 사이언스 응용_데이터 형식

데이터 사이언스 응용 과제를 하면서 겸사겸사 하나하나 뜯어보면서 코드를 쓰다보니까알아서 데이터 형식에 대해서 공부됨.. .ㅎㅎ 우선 왜 굳이 리스트로 형식을 바꿔서 저장하나 했는데, 이게 리스트의 장점이 있더라!바로 다양한 형식을 한 리스트에 저장할 수 있고, 데이터 프레임을 자유자재로 바꿀 수 있어서 데이터 전처리 할 때 유용함!! 이렇게 하나하나 공부해가는 중  과제하면서 모르던거, 정리하고 싶은 내용 정리! 첫번째로 데이터 형식에 대한 정리.1차원 데이터1차원 데이터 구조:리스트 (List):1차원 데이터입니다. 순차적으로 데이터가 나열된 단일 차원입니다.특징: 순서가 있으며, 중복을 허용하고, 변경 가능한 자료형입니다. 다양한 데이터 타입을 섞어 저장할 수 있습니다용도: 일반적으로 데이터의 순서를..

공부/파이썬 2024.10.24

[전산병] SQL과 관련된 병과

현재 LLM을 활용한 text to SQL로 SQL을 잘 모르더라도 쉽게 DB를 다룰 수 있도록하는 프로젝트를 하려고 한다. 이제 군대에서 SQL을 누가 다루는 지 정말 이 기술에 국방에 필요한지 판단하기 위해서 정보를 찾고 정리하려고한다.https://namu.wiki/w/%EC%A0%84%EC%82%B0%EB%B3%91 전산병전산병( 電 算 兵 )은 병과의 하나로, 군대 에서 전산 처리 업무를 맡은 병사를 말한다. 그러나 사실 컴퓨터를namu.wiki  1. 부대의 규모에 따라 다르다직할대, 연대급 이상: 전산 장교가 존재 - 제대로된 업무대대급 이하는 통신병과 전산일을 겸함.2. 장교와 병사의 차이예전: 전산병 - 전산자료 입력병 (키펀쳐)로 배치, 잘하는 경우 개발 진행3. 분야별 업무장비관리네트..

국방 2024.10.16

[뉴스] "유사시 北함정에 자폭”…군집 무인수상정 시연 현장

https://www.seoul.co.kr/news/society/2024/10/10/20241010500138 “유사시 北함정에 자폭”…군집 무인수상정 시연 현장국방과학연구소 세계최초로 시연 알고리즘 따라 자율운항·임무수행 서해 NLL 24시간 감시 활용 가능, 10일 경남 창원에 위치한 해군사관학교 앞바다, 북쪽으로부터 적군의 수상정 5척이 남하하자www.seoul.co.kr오늘부터 민이와 재관오빠랑 국방 및 인공지능 정보를 공유한다. 10시에 출근해서 딱 1시간씩 투자하려고 한다.   ‘군집 무인수상정 운용기술’ 시연적군의 수상정 5척이 남하하자 서도 부근에서 경계 작전을 펼치던 아군 수상정 10척이 1㎞ 앞에서부터 적을 에워쌌다. 10척의 배는 학습한 알고리즘에 따라 협동 작전을 수행하는 무인수상..

국방 2024.10.11

[연구] 논문 검색 툴

이제 AI기술 활용 어플리케이션이 미친듯이 쏟아져나오고 있다.이것을 어떻게 잘 활용하느냐에 따라서 나의 효율이 매우 달라진다. 물론 너무 남용하면 나에게 해가 될 수 있지만 ㅠ 나에게 필요한 것을 명확히 알고 해당 어플리케이션이 있는지 확인 후 잘 활용한다면 정말 좋은 도구가 될 수 있다.현재 내가 석사에서 하고 있는 단계는 Problem Space 찾기해당 논문들 많이 읽기Paper Proposal  이를 위해서 구글 스칼라에서 많은 논문들의 바다에 빠져야한다. 내가 원하는 주제의 연구가 있는지, 현재 내가 궁금한 도메인에 어떤 연구들이 진행이 되었는지, 내가 하려고 하는 연구가 정말 없는 지 잘 검색해야지, 헛수고를 덜 할 수 있다.즉 엄청 많은 논문들 사이에서 내가 설정한 PS와 관련된 논문들을 잘..

공부/기타 2024.10.09

[뉴스] K2전차·K9자주포 대량생산... 가성비 최고 '베스트셀러' 돼

https://www.chosun.com/economy/economy_general/2024/10/08/CPSZ2JO5ANEM5CT275WO546T6Q/ “K2 전차·K9 자주포, 대량생산으로 가성비 최고 ‘베스트셀러’ 돼”K2 전차·K9 자주포, 대량생산으로 가성비 최고 베스트셀러 돼 방현철의 경제로 세상 읽기 장원준 산업연구원 박사가 말하는 K방산의 경제학www.chosun.com내가 방산을 와서 방산 소식을 자주 접하는건지 아니면 정말 방산이 뜨고 있는건지 모르겠지만, 방산 관련 뉴스나 이야기들을 참 많이 듣는다. 뭐가 되었든 한국 방산의 미래가 밝아 보이며, 방산과 인공지능을 택한 나,,,, 정말 잘한 선택이였다. but 완전 관련 없던 도메인이여서 새로 배우는 것에 노력이 두배로 들지만, 그래도..

국방 2024.10.08

ZSL: Zero-shot learning

인공지능 분야에 있다보면 가끔 접하는 단어.제로샷 학습. 데이터 사이언스 응용 수업을 수강하다가 갑자기 궁금해진 개념.대강 이전에 본적 없는 제로. 제로를 겨냥하여 학습한다. 이런 개념으로만 해석이 되는데, 이 용어가 실무에서 사용되고 있기 때문에 명확하게 이 용어가 무슨 뜻인지 알아가보고자 한다.1. One-shot learning/Few-shot learning/Zero-shot learning먼저 이 개념을 알아보자.딥러닝 모델에서 시작된 이 세가지 용어.원샷, 퓨샷 학습은 데이터의 양을 나타내는 용어이다. 정리 [개념] 생성 AI의 학습 방식: 제로샷·원샷·퓨샷 러닝최근 챗GPT로 인해 부상한 제로샷(zero-shot), 원샷(one-shot), 퓨샷(few-shot) 러닝 기법은 데이터를 일일이..