13 5월 2999

Web Cloud & mobile App Business working Link

Web Cloud & mobile App Business working Link

  1. Biz Design Workplace
  2. Biz marketing tools Workplace
  3. Biz reference datas
    1. 프리렌서 업무 [크몽] : https://kmong.com/
    2. 모바일 앱 시장조사 [와이즈앱] : https://www.wiseapp.co.kr/
    3. 프리렌서 업무 [위시켓] : https://www.wishket.com
    4. 프리랜서 업무 [프리모아] : http://www.freemoa.net/
    5. 프리렌서 업무 [이렌서] : http://www.elancer.co.kr/
  4. Biz online Developing tool
  5. cloud developer console
    1. microsoft azure : https://azure.microsoft.com/ko-kr
    2. google developer console : https://console.cloud.google.com/?hl=ko
    3. amazon AWS : https://aws.amazon.com/ko/console/
  6. Mobile App Biz market
    1. android developer console : https://play.google.com/apps/publish/?hl=ko
    2. onestore (T Store) : http://dev.onestore.co.kr/devpoc/index.omp
    3. apple app store : https://developer.apple.com/app-store/
  7. 지적재산권 등록
    1. 특허정보검색(KIPRIS) : http://www.kipris.or.kr/khome/main.jsp
    2. 특허로(특허출원) : http://www.patent.go.kr/portal/Main.do

 

 

 

Loading

13 5월 2999

매일 들르는 곳 : nooksurfer : ホームページの閲覧えつらん者しゃ

매일 들르는 곳 : nooksurfer : ホームページの閲覧えつらん者しゃ

 

 

자주 들르는 곳 : Frequent stop :

 

모바일 (게임)개발툴 사이트

 

 

 웹 (사이트) 개발

 

 

디지털 마켓

 

 

멀티미디어 리소스 (마켓)

 

인문학과 사회와 재경학에 관심을 가져보자

 

오프라인 교육 기관

 

Loading

8 4월 2025

[一日30分 인생승리의 학습법] [알아봅시다] 블록체인 게임들의 가능성과 미래

[一日30分 인생승리의 학습법] [알아봅시다] 블록체인 게임들의 가능성과 미래

ChatGPT Image 2025년 4월 8일 오후 07_26_42.png

학습 차원에서 틈틈이 해외 전문가들이 블로그나 미디어 그리고 책에서 쓴 글을 번역 또는 요약 정리하고 있습니다. 이번 포스팅도 그중 하나고요. 거칠고 오역된 부분이 있을 수 있습니다. 제대로 번역되지 않은 부분은 확인 주시면 반영토록 하겠습니다. 이번글은 뱅크리스에 올라온 글을 정리한 것입니다.

2087년 이더리움이 마침내 주류가 되고 연준이 더 이상 존재하지 않게 되면, 역사학자들은 암호화폐의 기원을 2011년 블리자드가 비탈릭 부테린의 월드 오브 워크래프트 캐릭터에 ‘생명을 빨아들이는’ 주문을 너프(nerf)했던 운명적인 순간으로 거슬러 올라갈 것이다.

이 이야기는 15살의 비탈릭이 ‘중앙 집중식 서비스의 공포’에 눈을 뜨게 했고, 마침내 중앙 집중식 비디오 게임의 광기를 종식시킨 이더리움이 탄생하게 된 계기가 됐다.

적어도 우리는 그 방향으로 가고 있다.

안타깝게도 대부분의 기존 블록체인 게임들은 마케팅 페이지를 장식하는 무허가(permissionless) 상호 운용성과 진정한 소유권이라는 멋진 약속에도 불구하고 여전히 위의 검열 사례에 적용을 받을 수 있다.

현재 블록체인 게임들의 (거짓) 약속(The (false) promises of today’s blockchain games)

잠시 시간을 거슬러 올라가 블록체인의 목적을 다시 떠올려 보자. 블록체인은 분산된 데이터베이스에 대한 공유 합의를 촉진하는 역할을 한다. 사람들이 동의하지 않을 때 전체 암호화폐 커뮤니티가 체인 분할을 진행하기 위해 많이 노력하는 것도 이 때문이다. 포킹( Forking)은 화해할 수 없는 차이들 사이에서 합의를 재조정한다.

그렇다면 도대체 왜 블록체인을 기반으로 게임을 개발할까?

같은 이유:비탈릭이 자신이 사랑하던 흑마법사를 약화시키기로 한 블리자드의 결정에 동의하지 않았던 것처럼, 사람들은 게임 세계를 어떻게 구축해야 하는지에 대해 근본적으로 동의하지 않는다. 따라서 블록체인을 통한 게임의 진정한 가능성은 분열된 게임 커뮤니티가 서로의 차이를 해결할 수 있도록 하는 것이다.

문제는 대부분의 블록체인 게임이 여기에 미치지 못한다는 것이다. 액시 인피니티나 크립토키티와 같은 게임은 최소한의 온체인 게임이다. 자산은 온체인 데이터로 존재하지만, 게임의 기본 로직(게임 규칙)과 상태(게임 내 행동 기록)는 중앙화된 게임 서버, 오프체인에 있다.

물론 개인 키를 안전하게 보관하는 한, 당신의 액시(Axie) NFT와 토큰은 불변하는 스마트 컨트랙트 내 데이터로 영원히 존재한다. 하지만 엑시를 개발한 스카이 마비스가 문을 닫는다면, 당신의 엑스 자산 가치도 사라질 것입니다. 소유권은 단순히 지갑에 데이터를 보호하는 것 이상의 의미를 갖는다. 소유권은 해당 데이터가 어디에 있는지, 즉 게임 규칙을 통제하고 발언권을 가질 수 있는 힘이기도 하다.

이들 자산의 금전적 가치는 전적으로 스카이 마비스가 엑스 인피니티 생태계를 상업적인 제품으로 성공적으로 제공할 수 있는 능력에 달려 있다. 웹 3.0으로 광고되지만 플레이어는 오프체인과 중앙에서 계획된 게임의 기본 규칙을 거의 제어할 수 없기 때문에 웹 2.5에 더 가깝다.

실제 웹 3 게임들의 아키텍처(The architecture of actually Web3 games)

검열이 불가능하고 막을 수 없는 블록체인 게임을 만들려면 어떻게 시작해야 할까? 구브시프의 ‘가장 강력한 크립토 게임 논문’에 따르면: 

게임의 로직과 상태는 온체인에 있다. 게임의 규칙(이동, 전투, 채집, 소비 방법)은 오픈소스 및 온체인 스마트 컨트랙트에 규칙으로 포함되어야 한다.

모든 게임 데이터는 블록체인에 있으므로 상호 운용이 가능하다. 게임은 클라이언트에 구애받지 않는다. 

핵심 개발자가 내일 사라져도 플레이어는 게임을 계속 플레이하기 위해 개발자에게 의존할 필요가 없으며, 커뮤니티에 있는 사람들이 플레이어 움직임을 온체인으로 전송하는 자체 클라이언트를 만들 수 있다.

위의 조건들이 충족되면 몇 가지 중요한 일이 일어나기 시작한다.

퍼미션리스 혁신(Permissionless Innovation)

온체인 게임 로직은 첫째 회사가 파산하거나 개발을 포기하더라도 디파이 프로토콜이 영구적으로 실행되는 것과 같은 방식으로 게임 세계는 영속성을 확보하고 계속 존재한다. 로난 샌드포드의 말처럼, 온체인 게임은 ‘현실 독립성'(reality independence)을 제공한다.

둘째, 퍼미션리스 혁신에 문이 열려 있다. 모든 플레이어는 기본 게임 규칙(즉, 디지털 물리를 참조하는 스마트 컨트랙트 형태로 두 번째 레이어 규칙(큐리오는 이를 사용자 생성 로직이라고 부름)을 도입해 게임을 창의적으로 ‘모드'(mod: 게이머가 게임에 새로운 기능을 추가하는 것)할 수 있다.

이것은 혼란스럽게 들일 수 있지만 그렇지 않다. 이것은 간단히 말해 개발자가 기존 프로토콜 위에서 허가 없이 새로운 프로토콜을 구축하는 디파이 결합성 101((one-oh-one으로 발음, 모든 분야의 초보자 대상으로 준비된 과정)이다.

세컨드 레이어 규칙들이 기본 규칙을 위반하지 않는 한, 허용된다. 세컨드 레이어 규칙은 개인 사용자 인터페이스와 로컬 경험만 변경하는 기존 게임들의 애드온/모드와 달리, 다른 모든 플레이어와 공유하는 가상 게임 경험에 영향을 미치는 온체인 스마트 컨트랙트에 내장된다는 것을 주목할 필요가 있다.

예를 들어, 체스 말의 고전적인 움직임을 유지하기로 결정한 완전 온체인 체스 게임은 핵심 개발자의 스마트 컨트랙트에 고전적인 규칙을 협상할 수 없고 변경할 수 없는 것으로 명시할 것이다. 기사는 L자 모양으로만 움직일 수 있고 비숍은 대각선으로만 횡단할 수 있다.

하지만 누구나 이러한 변경 불가능한 디지털 물리학 위에 새로운 세컨드 레이어 규칙을 만들 수 있다. 토큰, 길드 시스템, 상대방의 왕을 점령해 게임에서 승리하는 대신 내 왕을 보드 반대쪽 끝으로 이동시켜야 승리하는 RPG와 같은 퀘스트 라인이 될 수 있다. 토큰 화폐를 통해 죽은 왕을 다시 사거나 상대방과 왕을 교환하는 거래 시스템을 도입할 수도 있다. 기본 규칙의 논리가 허용하는 한 무엇이든 가능하다.

진정한 상호 운용성(True Interoperability)

온체인 게임에서 자산은 하나의 엄격한 게임 로직에 얽매이지 않으며, 가장 넓은 의미에서 최대한 상호 운용이 가능하다. 디파이에서 수천 개 토큰이 자체 규칙 세트, 즉 토큰노믹스 모델을 기반으로 서로 경쟁하는 것과 마찬가지로, 게임 자산은 지속적으로 확장되는 게임 세계에서 또 다른 토큰으로 존재하기도 한다.

반면, 에픽은 포트나이트 게임 자산을 게임 라이브러리 내에서 상호 운용할 수 있도록 허용할 수 있지만, 개발자가 허용하는 경우에만 상호 운용이 가능하다. 웹 2.5 블록체인 게임의 게임 자산도 마찬가지다.

강력한 인센티브(High-Powered Incentives)

이제 퍼즐의 마지막 조각인 인센티브에 대해 알아보자. 기존 게임에는 매우 활발한 모딩 커뮤니티가 많지만, 핵심 개발자의 의지에 따라 운영된다. 마인크래프트 역사가 대표적인 사례다.

경제적인 측면에서 보면 모더들(modders) 재산권은 약하기 때문에 창작에 대한 인센티브가 약하다. 따라서 모드는 일반적으로 이타주의에 기반한 애호가나 취미로 운영되는 경우가 많다.

완전한 온체인 게임은 이 문제를 해결한다. 온체인 게임에서는 생성된 모드가 검열할 수 없고 영구적인 창작물(앞서 언급한 두 번째 레이어 규칙)이 불변의 스마트 컨트랙트에 코드화되므로 플레이어가 모드를 만들려는 인센티브가 더 강력해진다.

토큰, 게임 메커니즘, 사회적 제도, 게임 내에서 플레이어가 만든 규칙의 근간이 되는 소유권 규칙은 플레이어가 완전히 통제할 수 있으며, 허가된 게임 로직과 규칙의 기본 세트에 구속되지 않는다. 가장 중요한 것은 게임 경제 내에서 플레이어가 만든 다른 창작물과 경쟁한다는 것이다.

따라서 온체인 게임 세계에서는 핵심 게임 개발자가 일방적으로 바뀌는 게임 기본 규칙에 대해 스스로 손을 묶는 것을 약속한다. 이것이 바로 비탈릭의 월드 오브 워크래프트 툰(toon)을 살릴 수 있는 방법이다. 게임 독재의 시대는 지나갈 것이다. 이론은 충분했으니 이제 온체인 게임의 몇 가지 예를 살펴보자.

온체인 게임들 살펴보기(Looking at on-chain games)

다크 포레스트는 아마도 온체인 게임의 최고 예일 것이다. 0xPARC 재단의 Gubsheep이 개발한 다크 포레스트는 2019년부터 그노시스(Gnosis)  체인에 배포된 우주를 테마로 한 멀티플레이어 전략 게임이다.

다크 포레스트의 전체 게임 로직과 상태는 온체인에 포함돼 있다.  기존 온라인 게임과 달리 게임 동작을 처리하거나 게임 상태를 저장하는 중앙화된 서버나 데이터베이스가 없다.

앞서 설명한 것처럼, 온체인 게임의 마법은 플레이어가 온체인 속성을 활용해 자발적으로 생성할 수 있는 새로운 주문에 있다. 다크 포레스트에는 이러한 예가 무궁무진하다. 다크 포레스트 플레이어들은 핵심 개발자가 거래 시스템이나 경매장을 위한 패치를 도입하지 않고도 게임 내 자원을 거래할 수 있는 게임 내 마켓플레이스를 만들었다.

다크 포레스트에는 길드 시스템이 내장돼 있지 않기 때문에, 몇몇 플레이어(DFDAO)는 외부 스마트 컨트랙트를 통해 자체적으로 퍼미션리스 온체인 길드 시스템을 구축했다. 이를 통해 많은 소규모 플레이어가 완전히 무신뢰(trustless) 방식으로 자원을 조정하고 모을 수 있었고 숙련된 플레이어가 지배하는 리더보드에서 경쟁력을 갖추기 위한 의도로 사용됐다. DFDAO 블로그에 설명된 대로

DFDAO는 또한 다크 포레스트 게임을 완전히 다른 체인으로 포크했다. 다크 포레스트 아레나라는 포크 버전은 다양한 새로운 게임 모드를 도입했다. 다른 MMORPG에서는 이러한 모든 행위가 불법, 암시장 거래 또는 “해킹”으로 간주될 것이다.  다크 포레스트와 같은 온체인 게임에서는 모든 것이 허용되고 코드 상에서 실행된다.

커뮤니티가 주도한 긴급 명령의 예는 Lattice 팀이 만든 마인크래프트 온체인 버전인 OPCraft에서도 찾아볼 수 있다.  OPCraft의 초기 테스트 출시에서 플레이어들은 자원 수집을 자동화하고, 서로 채팅하고, 맵을 텔레포트하고, 월드 색상을 변경하는 플러그인을 만들었다.

SupremeLeaderOP라는 이름의 한 플레이어는 온체인 스마트 컨트랙트를 배포해 일련의 규칙이 포함된 공산주의 공화국을 만들었다. 자발적으로 공화국에 가입한 모든 플레이어는 사회주의 철학에 따라 기존의 모든 재산을 포기하고 재고를 공동의 국고로 통합해야 했다.

물론 게임에서 긴급 명령의 예는 새로운 것이 아니다. 이브(eve) 온라인 플레이어들은 게임 제작자가 게임 내 길드 도구를 만들지 않았을 때 디스코드(Discord)에서 오프라인 소셜 동맹을 조직했다. 에버퀘스트와 월드 오브 워크래프트 플레이어들은 비공식적인 소셜 화폐 시스템인 ‘DKP(드래곤 킬 포인트)’를 개발해 게임 내 공격대에 투입한 시간에 따라 플레이어를 관리하고 보상을 제공했다.

완전 온체인 게임들에 장애물들(Obstacles to fully on-chain games)

온체인 게임이 그렇게 훌륭하다면 왜 더 널리 보급되지 않았을까? 온체인 게임이 직면한 가장 명백한 장애물은 확장성이다. 모든 플레이어 행동을 온체인으로 전송하는 것은 연산 집약적이기 때문에 대부분의 온체인 게임은 이더리움 메인넷이 아닌 턴 기반(turn-based) 게임이다. 온체인에 영구적으로 존재하는 변경 불가능한 코드는 개발자 부주의로 인해 발생하는 익스플로잇을 패치하기 어렵다는 것을 의미한다.

퍼미션리스 게임은 또한 기회주의적인 플레이어와 봇에게 문호를 개방하는 것을 수반한다. 기존 블록체인 게임인 엑시(Axie)나 페가시(Pegaxy)는 비용이 많이 드는 진입 장벽을 통해 이를 어느 정도 완화하고 있으며, 기존 게임들은 KYC 방법과 선별적 차단을 통해 이러한 문제를 해결하지만, 퍼미션리스 온체인 게임에서는 이러한 중앙화된 수단을 사용할 수 없다.

어떤 면에서 온체인 게임의 문제는 사회적 고착화와 집단 행동 문제로 인해 변화하기 어려운 불완전한 현실 세계 제도(제국주의 체제나 민주주의 정치를 생각해보라)와 매우 유사하다. 커뮤니티와 핵심 개발자 모두가 이러한 문제에 직면해 나쁜 행동을 노골적으로 검열하기보다는 기업가적인 해결책과 창의적인 메커니즘 설계를 통해 나쁜 행동을 억제해야 한다.

이러한 창작물이 다른 점은 게임의 개방적인 구성 덕분에 허가 없이 생성되고 온체인에 내장된다는 점이다.. OPCraft 공산주의 공화국 플레이어들은 그가 누구인지 몰랐지만, 그가 약속을 지킬 것이라는 믿음을 가질 필요는 없었다.

그노시스 체인 기반 외교 전략 게임인 Conquest에서 플레이어는 xDAI 토큰을 스테이킹해 우주선을 생산하고, 동맹을 맺고, 문명 방식으로 서로를 공격한다. 다시 말하지만, 온체인 스마트 컨트랙트를 생성할 수 있다는 것은 플레이어 동맹이 실제 가치가 있는 자산에 묶여 있다는 것을 의미하며, 플레이어 동맹 간 신뢰 없는 상호작용을 보여준다.

온체인 게임에 대한 간단한 참고 사항(A quick note on on-chain game)

온체인 게임은 아직 개념 증명 단계에 머물러 있다. 개발자들은 여전히 최적의 확장 방법을 찾기 위해 노력하고 있으며, 용어 또한 산재되어 있다. 래티스(Lattice)는 이를 자율 세계(Autonomous Worlds)라고 부르고, 비블리오테카(Bibliotheca ) DAO에서는 영원한 게임, 이터널 게임스(Eternal Games) 플레이에서는 무한 게임, 토폴로지에서는 온체인 현실(on-chain realities)이라고 부릅니다. 당신은 아이디어를 얻을 수 있다.

위의 예시는 온체인 게임에서 떠오르는(emergent orders )  몇 가지 사례들일 뿐이지만, 가능성은 무궁무진하다. 모든 디앱의 루트가 블록체인에 공유 상태로 존재하기 때문에 디파이의 오픈소스 구성성을 통해 토큰이 상호 운용되고 다양한 방식으로 잘게 쪼개질 수 있는 것처럼, 블록체인을 완전히 수용하는 게임도 마찬가지일 것이다.

게임 내 통화로 나만의 ERC20 토큰을 발행하라. 종교, 국가, 파벌 등 상상할 수 있는 모든 사회 구조를 형성하고 이를 체인에 올려보라. 보상이나 처벌이 포함된 퀘스트 라인을 토큰으로 작성하고 이를 변경 불가능한 스마트 컨트랙트에 연결해 보라.

기존 게임처럼 현실 세계와 분리되어 있지 않기 때문에 이를 ‘게임 내 경제’라고 부르는 것은 잘못된 명칭이다. 이는 크리에이터와 플레이어 간 경계를 허무는 현실 세계의 가치 경제이고 블록체인에 영구적으로 존재한다. 블록체인은 개인이 자발적으로 내리는 수많은 결정에서 새로운 생산과 거래 방식을 자유롭게 실험하며 지속적으로 발전할 수 있는 역량을 갖추고 있으며, 플레이어가 경제적 가치를 포착할 수 있는 무한한 길을 제공한다.

마무리하며

이 글에서 기존 블록체인 게임에 대해 혹평했지만, 웹 2.5 게임이 여전히 기존 게임보다 더 강력한 소유권을 제공한다는 점은 주목할 가치가 있다. 웹 2.5 게임은 적어도 플레이어가 자유롭게 게임을 종료할 수 있다. 자산이 지적 재산으로 보호되어 판매할 수 없는 기존 게임과 달리, 플레이어는 게임 내 토큰을 판매하고 자신의 시간에 대한 보상을 받을 수 있다.

하지만 웹 2.5 게임이 기존 게임보다 나은 점은 완전한 온체인 게임과 비교했을 때 미치지 못하는 것이기도 하다.

오프체인 게임 로직은 게임이 블록체인 기술의 잠재력을 충분히 활용하지 못하도록 방해한다. 완전한 온체인 게임만이 개방적이고 퍼미션리스 블록체인 인프라가 허용하는 인간의 독창성을 제대로 활용할 수 있다.

가장 위대한 비디오 게임 타이틀과 장르 중 일부는 ‘창발적 질서(emergent order)’의 부산물이다. 이 게임들은 게임 애호가와 취미로 게임을 즐기는 사람들이 “일단 해보고 보자”라는 공통된 패턴을 보여준다. 선풍적인 인기를 끌었던 MOBA(도타)와 타워 디펜스 장르는 모두 워크래프트 3 커스텀 게임 모딩 커뮤니티의 창작물에서 비롯됐다. 배틀그라운드: 배틀그라운드는 원래 FPS 슈팅 게임인 DayZ의 모드로, 다른 FPS 슈팅 게임인 아르마 2의 모드였다. 카운터 스트라이크는 90년대 가장 인기 있었던 게임 중 하나인 하프라이프의 모드였다. 온체인 게임은 이를 한 단계 더 발전시킨 것이다.

[출처] https://brunch.co.kr/@delight412/538

Loading

30 3월 2025

[인공지능 기술]  [Pytorch] Pytorch & LLM Training Pipeline (pytorch로 chatgpt만들기, 기본예제)

[인공지능 기술]  [Pytorch] Pytorch & LLM Training Pipeline (pytorch로 chatgpt만들기, 기본예제)

Pytorch

Pytorych

What

Pytorch는 Opensource Machine Learning(ML) Framework로, Python 언어와 Torch Library를 기반으로 한다. Torch는 Opensource ML Library로, Deep learning을 이용하기 위해서 Lua Scripting으로 작성되었다. 현재, DL 연구를 위해서 가장 선호되는 플랫폼이다.

How to use?

Tools

Pytorch는 클라우드와 로컬, 두 가지 환경에서 활용할 수 있다.

  • In the cloud: Pytorch를 접근하기 가장 쉬운 방법으로, Microsoft를 통해서 접근하거나 Google Colab에서 실행해 볼 수 있다. 링크에만 접근한다면 Microsoft와 Colab에 작성된 Notebook에서 코드를 실행할 수 있다.
  • Locally: 로컬에서는 PyTorch and TorchVision 등을 우선 설치해야한다. 설치 가이드(installation instructions)를 따라서 설치할 수 있다. 다양한 버전이 홈페이지에 게재되어있다. Notebook을 활용하거나 IDE()에서 코드를 작성하여 실행하면 된다.

Pipieline

01 Prerequisites

Pytorch는 python 프로그래밍을 통해,딥러닝과 트랜스포머 개념을 구현해야한다.

02 Library installation

trl : Transformer language odel을 Reinforcement Leanring으로 학습하는데 사용한다.
peft : Prameter-effiecient Fine-tuning(PEFT)방법을 통해서 효율적으로 pre-treined model을 조정한다.
torrch : Opensource ML library
datasets : ML datasets을 로딩(loading) 또는 다운로딩(downloading)하기 위해 하용한다.
Trasformers : Hugging Face가 개발한 라이브러리로, 분류/요약/번역 등과 같은 다양한 텍스트를 위한 task를 수행하기 위해 수천 개의 PLM(pre-trained model)모델을 제공한다.

02-1 pip 를 통해서 pythong package 다운로드한다.

%%bash
pip -q install trl
pip -q install peft
pip -q install torch
pip -q install datasets
pip -q install transformers

02-1 import 통해서 pythong package를 가져온다

import torch
from trl import SFTTrainer
from datasets import load_dataset
from peft import LoraConfig, get_peft_model, prepare_model_for_int8_training
from transformers import AutoModelForCausalLM, AutoTokenizer, TrainingArguments

03 Data Loading and Preparation

03-01 Data loading

허깅페이스의 공개 데이터셋을 로드한다.
load_dataset : 데이터 로드
dataset_name : 로드하기 위한 데이터셋 이름
split parameter를 “train“로 설정하여 학습(traing)데이터로만 설정된 데이터 로드

dataset_name="tatsu-lab/alpaca"
train_dataset = load_dataset(dataset_name, split="train")
print(train_dataset)

03-02 Converting the dictionary into a pandas dataframe

로드한 데이터는 dictionary 타입으로, pandas의 dataframe으로 변환한다.

.to_pandas() : train_dataset을 pandas dataframe으로 변환

pandas_format = train_dataset.to_pandas()
display(pandas_format.head())

04 Model Training

  • Pre-trained Model : Pretrained 모델
  • Tokenizer : 데이터의 토큰화(tokenization)를 위해 사용하며, PLM과 tokenizer를 가져옴
  • AutoModelForCausalLM :
    • from_pretrained 메서드로 PLM을 가져오기 위해 사용
    • pretrained_model_name은 PLM 모델을 지정하며, data type은 모델의 tensor를torch.bfloat16로 설정

*AutoTokenizer:

  • from_pretrained : 가 PLM에 맞는 tokenizer를 가져오기 위해 사용하는 메서드
  • pretrained_model_name과 trust_remote_code를 true로 설정
pretrained_model_name = "Salesforce/xgen-7b-8k-base"
model = AutoModelForCausalLM.from_pretrained(pretrained_model_name, torch_dtype=torch.bfloat16)
tokenizer = AutoTokenizer.from_pretrained(pretrained_model_name, trust_remote_code=True)

05 Training configuration

Training을 위해 training arguments(인수)와 training configurations(구성)이 필요하다. 이는 TrainingArguments로 구성하며, LoraConfig model과 SFTTrainer model의 인스턴스이다.

06 TrainingArguments

output_dir 학습 모델 저장 위치
per_device_train_batch_size 한 학습에 사용하기 위한 학습 샘플의 사이즈
optim 옵티마이저
logging_steps 로깅을 위한 빈도로, n번의 스텝마다 기록
learning_rate 옵티마이저의 learning rate 설정
warmup_ratio
lr_scheduler_type
num_train_epochs
save_strategy

model_training_args = TrainingArguments(
       output_dir="xgen-7b-8k-base-fine-tuned",
       per_device_train_batch_size=4,
       optim="adamw_torch",
       logging_steps=80,
       learning_rate=2e-4,
       warmup_ratio=0.1,
       lr_scheduler_type="linear",
       num_train_epochs=1,
       save_strategy="epoch"
   )

07 LoRAConfig

LoRa(Low-Rank Adaptation)은 Hugging Face가 개발한 PEFT이다. peft 라이브러를 통해서 사용할 수 있다.
현재의 파이프라인에서는 하위 변환 행렬을 16으로 설정한다. LoRa의 매개변수의 스케일링 계수는 32로 서렁한다. 드롭아웃 비율은 0.05로 설정되었다.
CASULA_LM은 인과적 언어 모델(causual lanauge model)의 속성을 초기화한다.

08 SFTTrainer

training data, tokenizer, 모델의 추가 정보를 이용하여 학습한다.

아래는 로드한 텍스트 칼럼의 길이를 컬럼을 추가하여 저장하는 것이다. 이 데이터셋은 0~1000 크기의 텍스트 분포가 크다. (분포를 보여주는 표는 생략)
1024보다 큰 값의 비율을 구한다.

pandas_foramt은 특정 칼럼의 크기가 1024보다 큰것을 찾아 mask로 저장
percentage에 mask가 ‘texst_length’컬럼에서 차지하는 비율을 구함

pandas_format['text_length'] = pandas_format['text'].apply(len)

mask = pandas_format['text_length'] > 1024
percentage = (mask.sum() / pandas_format['text_length'].count()) * 100

print(f"The percentage of text documents with a length greater than 1024 is: {percentage}%")
  • 아래 코드는 SFTTrainer 의 인스턴스를 만들고 있다.
    model=model PLM을 SFTTrainer에 전달
    train_dataset=train_dataset train dataset을 SFTTrainer에 전달
    dataset_text_field="text" 텍스트 데이터를 포함하는 dataset 필드 지정
    max_seq_length=1024 모델 력의 최대 시퀀스 길이를 설정
    tokenizer=tokenizer tokenizer를 SFTTrainer에 전달
    args=model_training_args 모델 트레이닝을 위한 인수를 SFTTrainer에 전달
    packing=True효율적인 훈련을 위한 시퀀스 패킹 설정
    peft_config=lora_peft_config PEFT에 loraConfig 설정
SFT_trainer = SFTTrainer(
       model=model,
       train_dataset=train_dataset,
       dataset_text_field="text",
       max_seq_length=1024,
       tokenizer=tokenizer,
       args=model_training_args,
       packing=True,
       peft_config=lora_peft_config,
   )

09 Training execution

tokenizer.pad_token =tokenizer.eos_token padding token을 eos_token으로 설정(eos, end of sequence)
model.resize_token_embeddings(len(tokenizer)) 모델의 토큰 임베딩 계층을 tokenizer 길이로 설정
model=prepare_model_for_int8_training(model)) 양자화처럼, INT8 정밀도로 트레이닝할 수 있도록 준비
model = get_peft_model (model, lora_peft_config) 주어진 모델을 PEFT 구성에 따따 조정
training_args = model_training_args training_args에 미리 정의된 training 인수를 할당
trainer =SFT_Trainer SFTTrainer 인스턴스를 trainer에 저장
trainer.train() (위의) 설정에 따라 모델을 학습

tokenizer.pad_token = tokenizer.eos_token
model.resize_token_embeddings(len(tokenizer))
model = prepare_model_for_int8_training(model)
model = get_peft_model(model, lora_peft_config)
training_args = model_training_args
trainer = SFT_trainer
trainer.train()

Reference
[1] https://pytorch.org/tutorials/beginner/basics/intro.html
[2] https://www.datacamp.com/tutorial/how-to-train-a-llm-with-pytorch
[3] https://github.com/keitazoumana/Medium-Articles-Notebooks/blob/main/Train_your_LLM.ipynb

[출처] https://velog.io/@jasmine_s2/Pytorch-Pytorch-LLM-Training-Pipeline

Loading

29 3월 2025

[인공지능 기술] 바닥부터 시작하는 인공지능  [수학공부]인공지능을 위한 수학 총정리/ 요약본 다운로드

[인공지능 기술] 바닥부터 시작하는 인공지능  [수학공부]인공지능을 위한 수학 총정리/ 요약본 다운로드

안녕하세요. 오늘은 “인공지능을 위한 수학”이라는 책을 읽은 감상을 남겨보려고 합니다. 우선, 이 책은 일본에서 출판된 책인데요, 

 

 

[요약본] 딥러닝을 위한 수학 Math.pdf

 

 

딥러닝, 머신러닝에 입문하는 사람들 중 수학에 해박하지 않은 사람들을 위해 기본적이지만 핵심적인 수학적 내용을 담고있는 책입니다.

물론 저도 수학을 좋아하기는 해도 막상 딥러닝을 공부하다보면 애매하게 느껴지거나 잘 이해가 안되는 수학적인 부분이 있었는데요, 이 책을 읽고 나서 상당부분 해결이 됐고, 조금은 자신감이 생긴것 같습니다.

 

 

 

이 책은 문과를 졸업한 사람도 충분히 읽을 수 있도록 친절하게 설명되어있어요. 삼각함수, 미분, 선형대수, 통계와 같은 기본적인 내용들과 함께 자연어처리, 이미지처리에서 쓰이는 수학적인 부분들도 쉽지만 꽤 자세하게 설명이 되어있기 때문에 도움이 많이 되었습니다.

머신러닝, 딥러닝에 입문하시는 분이시라면 꼭 읽어보시기를 추천드려요.

 

 

 

하지만 이런저런 공부를 하다보면 시간이 충분하지 않죠. 그래서 오늘은 제가 읽고 핵심내용을 정리한 요약본은 여러분께 공유하고자 합니다.

 

 

직접 제작한 표지

 

제가 모르는 부분을 중점적으로 정리한 것이기 때문에 요약본만 보고는 이해가 완벽하지 않을 수 있기 때문에 모르는 부분은 책을 더 참고하시거나, 아니면 댓글로 남겨주시면 제가 시간이 될때 답변 해드리도록 할게요! 

 

 

아래 이미지는 어떤식으로 정리되어있는지 보여드리기 위한 샘플입니다. 전체 pdf본을 원하시는 분은 첨부파일에서 다운받으실 수 있어요(최상단 참조).

받아가실때 댓글 한번씩 부탁드립니다 ^^

 

vector부분 정리

 

선형회귀부분 정리

 

자연어처리 부분 정리

 

[출처] https://doctorham.tistory.com/30
 

Loading

22 3월 2025

[profit] 60세가 넘은 IT 개발자가 은퇴 후에도 계속 일하며 노후를 대비하는 방법

[profit] 60세가 넘은 IT 개발자가 은퇴 후에도 계속 일하며 노후를 대비하는 방법

60세가 넘은 IT 개발자가 은퇴 후에도 계속 일하며 노후를 대비하는 방법

60세가 넘은 IT 개발자가 은퇴 후에도 계속 일하며 노후를 대비하고 싶다면, 다양한 경로를 고려할 수 있습니다. 

이러한 경로는 개인의 기술적 전문성, 경험, 그리고 흥미를 기반으로 선택할 수 있으며, 지속 가능한 수입원을 확보하고 지적으로 활동적인 생활을 유지하는 데 도움이 될 것입니다. 다음은 은퇴한 IT 개발자가 고려할 수 있는 몇 가지 방법입니다.

1. 프리랜서 개발

 – 개발을 진심으로 꾸준히 그리고 잘 해왔다면 프리랜스 개발을 하는 데에 있어서 문제가 없어야 합니다. 자신의 경험과 지식을 바탕으로 프리랜서 개발 전문 분야를 정의합니다. 클라우드 컴퓨팅, 사이버 보안, 데이터 분석, 소프트웨어 개발, IT 인프라 관리 등 IT 분야는 매우 넓기 때문에, 특정 기술이나 산업에 초점을 맞추는 것이 중요합니다.

 – 제공할 서비스를 명확히 하고, 시간당 요금, 프로젝트별 요금, 또는 가치 기반 요금 등 가격 전략을 개발합니다. 경쟁력 있는 가격 설정과 함께 고객에게 명확한 가치를 제시할 수 있어야 합니다.

 – [온라인 프로필 및 포트폴리오 구축] LinkedIn, GitHub, 개인 웹사이트 등 온라인 플랫폼을 활용하여 전문 프로필을 구축하고, 이전 프로젝트나 업적을 포트폴리오로 제시합니다. 이는 잠재 고객에게 신뢰와 전문성을 전달하는 중요한 수단입니다. 뿐만 아니라 오프라인에서도 네트워킹을 계속해야 합니다. 전문 네트워킹 이벤트, 콘퍼런스, 워크샵 참여를 통해 업계 내 네트워크를 확장합니다. 또한 소셜 미디어, 블로그, 이메일 뉴스레터 등 다양한 채널을 통해 마케팅 활동을 진행하여 자신의 서비스를 알립니다.

 – [프리랜서 플랫폼 활용] Upwork, Freelancer, Toptal과 같은 프리랜서 플랫폼에 프로필을 등록하고, 프로젝트를 찾습니다. 이러한 플랫폼은 다양한 고객과 프로젝트에 접근할 수 있는 기회를 제공합니다.

 – [지속적인 학습 및 업데이트] 기술 분야는 빠르게 변화하기 때문에, 최신 기술 동향, 툴, 프레임워크를 지속적으로 학습하고 업데이트하는 것이 중요합니다. 온라인 코스, 웨비나, 산업별 보고서 등을 활용하여 지식을 갱신합니다.

그런데 아마 나이가 있어서 프리랜서 개발자로 고용이 되지 않을 확률이 매우 높습니다. 왜냐하면 젊고 저렴하고 생기 있는 인력들이 시장에 많이 있는데 굳이 비싼 돈을 들여서 노인 인력을 채용하려고 할까요? 그렇지 않습니다. 시장은 냉정합니다.

2. 교육, 강의 및 트레이닝

– IT 시장은 지속적인 교육이 필요한 산업입니다. 꾸준하게 교육을 필요로 하는 수요가 있고 기업, 개인, 학생, 학교 가릴 것 없이 많은 교육을 필요로 합니다. 이러한 강의 수요에 맞춰서 교육을 하는 교육자가 되는 것도 하나의 방법입니다.

– 자신의 전문 지식과 경험을 바탕으로 어떤 IT 교육 분야에서 강의할 수 있는지 결정합니다. 예를 들어, 소프트웨어 개발, 데이터 분석, 사이버 보안, 클라우드 컴퓨팅 등이 있습니다. 시장 조사를 통해 수요가 높고 경쟁이 적은 틈새 시장을 찾아보세요.

– 교육할 내용에 가장 적합한 학습자 그룹을 결정합니다. 예를 들어, 초보자를 대상으로 하는 기초 과정, 경력 개발자를 위한 고급 과정, 또는 특정 산업 분야에 종사하는 전문가를 위한 맞춤형 교육 등이 있을 수 있습니다.

– 강의할 내용에 대한 포괄적인 커리큘럼을 개발합니다. 이는 강의 목표, 학습 결과, 강의 자료, 실습 과제, 평가 방법 등을 포함해야 합니다. 현업에서의 실제 경험을 반영하여 실용적이고 적용 가능한 지식을 전달하는 것이 중요합니다.

– 프레젠테이션, 비디오, 실습 자료, 퀴즈 등 다양한 형태의 강의 자료를 준비합니다. 또한, GitHub, Jupyter Notebooks, 클라우드 서비스 등 실습에 필요한 도구와 플랫폼을 설정합니다.

– [교육 플랫폼 및 기관과 협력] 교육 과정을 제공할 플랫폼이나 기관을 찾습니다. 대학교, 평생 교육 센터, 전문 교육 기관, 온라인 교육 플랫폼(Udemy, Coursera 등)과 협력할 수 있습니다. 60세가 넘었기 때문에 박사급이나 기술사가 아닌 이상 오프라인 출강은 솔직히 어려울 수 있습니다. 1번과 동일한 이유 때문입니다. 시장에 젊고 생기 있는 인력들이 넘치는데 굳이 교육에 있어서 60세 넘은 노인을 채용할까요? 그렇지 않습니다. 그렇기 때문에 결국 교육을 하더라도 온라인 강의 플랫폼으로 진출할 수 밖에 없는 것이지요.

– [온라인 강의 홍보] 소셜 미디어, 블로그, 이메일 마케팅, 워크샵, 콘퍼런스 등을 통해 교육 과정을 홍보합니다. 개인적인 네트워크와 전문가 커뮤니티를 활용하는 것도 좋은 방법입니다.

– [자격증 교육] 특정 분야에서 자격증을 취득하거나 지속적으로 최신 기술과 교육 방법을 학습하여 자신의 교육 내용을 갱신합니다. 이는 교육자로서의 신뢰성을 높이고 학습자에게 최신 지식을 제공하는 데 도움이 됩니다. 그나마 신기술 교육이 아니라 자격증 교육이라면 나이가 있어도 도전해볼 수 있는 분야입니다. ISMS-P 인증 심사 자격증, PMP 자격증, CISA, CIA, CISSP, 정보관리기술사, 정보처리기술사, 컴퓨터시스템응용기술사, 정보통신기술사, 정보시스템감리사 등 여러 자격증 교육은 나이가 아닌 경험을 중요시 하기 때문입니다. 물론 이러한 분야에서 교육을 하기 위해서는 자격증을 미리 취득해야 했어야 합니다.

 -교육자, 개발자, 산업 전문가로 구성된 네트워크와 커뮤니티에 참여합니다. 이를 통해 경험을 공유하고, 학습자를 위한 추가 자원과 기회를 발굴할 수 있습니다.
은퇴한 IT 개발자가 교육 및 트레이닝 분야에 진출하는 것은 자신의 지식과 경험을 나누고, 학습자들의 커리어 발전에 기여하며, 동시에 지속 가능한 수입원을 확보할 수 있는 효과적인 방법입니다. 이 과정에서 중요한 것은 자신의 전문 지식을 최대한 활용하고, 학습자의 필요와 흥미를 충족시키는 교육을 제공하는 것입니다.

3. 스타트업 창업 (기술 서비스 창업)

60세가 넘은 IT 개발자가 은퇴 후에도 계속 일하며 노후를 대비하는 방법으로 스타트업에 참여하거나 창업하는 것은 경험과 지식을 활용하여 새로운 기회를 창출하는 흥미로운 방법입니다. 다음은 스타트업 참여 또는 창업을 위한 상세한 단계입니다.

가. 아이디어 및 시장 조사
혁신적인 사업 아이디어를 개발하거나, 기술적 해결책이 필요한 시장의 문제를 식별합니다. 이 과정에서 경험, 전문 지식, 그리고 열정이 중요한 역할을 합니다.
타겟 시장을 정의하고, 경쟁 분석을 실시하여 시장의 수요와 경쟁 상황을 파악합니다.

나. 사업 계획 수립
사업 아이디어, 시장 분석, 마케팅 전략, 재정 계획 등을 포함하는 사업 계획서를 작성합니다. 사업 계획은 목표를 설정하고, 자금 조달, 파트너십 구축, 사업 운영에 필요한 로드맵 역할을 합니다.

다. 자금 조달
개인 자본, 가족 및 친구, 엔젤 투자자, 벤처 캐피탈, 크라우드펀딩 등 다양한 자금 조달 방법을 탐색합니다. 사업 계획의 신뢰성과 잠재적 성장 가능성을 투자자에게 설득할 수 있어야 합니다.

라. 팀 구성
사업을 함께 운영할 창업 팀을 구성합니다. 다양한 전문성을 갖춘 팀원을 선발하여 사업의 성공 가능성을 높입니다. 팀 구성원 간의 역할과 책임을 명확히 합니다.

마. 제품 개발 및 시험
최소 기능 제품(MVP, Minimum Viable Product)을 개발하여 시장에서의 반응을 테스트합니다. 이를 통해 제품이나 서비스를 지속적으로 개선하고 사용자의 요구를 충족시킬 수 있습니다.

바. 마케팅 및 브랜딩
타겟 시장에 맞는 마케팅 전략을 수립하고, 브랜드 인지도를 높이기 위한 활동을 계획합니다. 온라인 마케팅, 소셜 미디어 활용, 콘텐츠 마케팅 등 다양한 방법을 활용합니다.

사. 네트워킹 및 파트너십
업계 내 네트워킹을 통해 비즈니스 기회를 확장하고, 다른 기업이나 조직과의 파트너십을 구축합니다. 이는 사업의 성장을 가속화하고, 시장 접근성을 높일 수 있는 중요한 전략입니다.

아. 사업 운영 및 관리
효율적인 사업 운영을 위한 체계를 구축합니다. 재정 관리, 고객 관리, 제품 개발 프로세스 등 사업의 모든 측면에서 체계적인 관리가 필요합니다.

자. 성장 전략 및 확장
초기 성공 후 사업을 확장하기 위한 전략을 수립합니다. 새로운 시장 진입, 제품 라인 확장, 국제 시장으로의 확장 등 다양한 성장 전략을 고려할 수 있습니다.

차. 지속 가능성 및 사회적 책임
사업이 장기적으로 지속 가능하고 사회적으로 책임감 있는 방향으로 운영될 수 있도록 계획합니다. 환경, 사회, 거버넌스(ESG) 요소를 고려한 사업 모델을 구축합니다.

60세가 넘은 IT 개발자가 스타트업 참여 또는 창업을 통해 은퇴 후에도 계속 일하는 것은 새로운 도전을 추구하고, 사회에 기여하며, 경제적으로도 독립적일 수 있는 훌륭한 방법입니다. 이러한 과정은 준비와 노력이 필요하지만, 자신의 경험과 지식을 살려 새로운 가치를 창출하는 매우 보람찬 경험이 될 것입니다. 하지만, 웬만한 실력이 있는 개발자도 창업을 하기란 쉽지 않습니다. 팀 구성과 자금 모달에서부터 많은 어려움을 겪습니다. 이것 역시 현실적으로 쉽지 않은 노후 대비 방법입니다.

4. 아르바이트 (노인 알바, 단순 노동, 공장 알바, 배달 알바, 식당 알바 등)

– IT와 관련이 없는 산업에서 근무하는 것도 흔한 노후 대비 방법 중 하나 입니다. 실제로 개발자를 30년 넘게 하시고 은퇴한 선배님께서 시설 관리 업체에서 근무하고 있다는 소식을 들은 적 있습니다. 60세가 넘어도 수입은 필요하지만 60세가 넘은 노인을 고용하는 기업은 많이 없습니다. 그렇기 때문에 어쩔 수 없이 수입이 필요하여 어떠한 일이라도 하는 것입니다.
 – 하지만 이러한 아르바이트 수입을 얻는 데에 있어서 어려운 점이 있습니다. 건강 상태입니다. 아르바이트는 보통 육체적인 노동 강도를 요구하는 경우가 많습니다. 하지만 60세가 넘은 노인의 건강 상태가 젊은 사람들보다 건강하지 않을 확률이 높으며 미래에는 로봇과 키오스크가 여러 단순 노동 일자리를 대체할 것입니다. 이러한 문제점들은 노인들이 60세 이후에 단순 노동 일자리를 얻는 데에 어려움을 동반합니다.

– 또한 근무 중 다칠 위험이 항상 존재한다는 점이 있다는 것입니다.

5. 정보관리기술사 취득 (현실적인 방법)

60세가 넘은 IT 개발자가 은퇴 후에도 계속 일하며 노후를 대비하는 방법으로 보안 감사 및 컨설팅에 진출하는 것은 높은 수요와 전문성을 요구하는 분야입니다. 이러한 경로는 풍부한 경험과 전문 지식을 활용하여 기업이나 조직의 정보 보안을 강화하는 데 큰 기여를 할 수 있습니다. IT 개발자가 은퇴 이후에 노후를 준비하는 방법은 정보관리기술사 자격증을 취득하는 것이 가장 현실적인 방법입니다.

정보 보안 분야에서 요구되는 전문 지식과 기술을 갖추기 위해 정보관리기술사, 정보시스템감리사, 컴퓨터시스템응용기술사, CISSP(인증 정보 시스템 보안 전문가), CISA(인증 정보 시스템 감사사), CEH(인증 해킹 전문가) 등의 자격증을 취득합니다. 이는 전문성을 인증하고 신뢰성을 높이는 데 중요합니다.

은퇴 전 쌓아온 경험과 전문 지식을 바탕으로 제공할 수 있는 보안 컨설팅 서비스를 정의합니다. 예를 들어, 사업 컨설팅, 사업 감리, 프로젝트 전산감사, 보안 정책 개발, 위험 평가, 침투 테스트, 사이버 보안 교육, 컴플라이언스 감사 등이 있습니다.

정보관리기술사를 취득하고 이력서를 여러 감리업체에 제출하면 많은 곳에서 잡 오퍼를 받을 수 있습니다. 정보관리기술사와 감리사는 정해진 정년이 없기 때문에 몸과 정신이 건강하기만 하다면 70대에도 계속 근무할 수 있습니다. 보안 서비스가 필요한 시장과 타겟 고객을 분석합니다. 중소기업, 스타트업, 교육 기관, 비영리 조직 등 다양한 고객군을 대상으로 할 수 있으며, 각 고객의 특정 요구와 문제점을 해결할 수 있는 맞춤형 서비스를 계획합니다.
– 기술사 자격증을 취득하면 기술사협회에 등록할 수 있고 기술사협외 분기마다 모임이 있습니다. 그곳에서 여러 기술사분들과 식사를 할 수 있고 업계 내외의 네트워킹을 통해 비즈니스 기회를 확장할 수 있습니다. 보안 업계의 다른 전문가, IT 서비스 제공업체, 법률 및 규제 컨설팅 회사와의 파트너십을 구축하여 서비스의 범위와 영향력을 확대할 수 있습니다.
– 60세가 넘은 IT 개발자가 보안 감사 및 컨설팅 분야에 진출하는 것은 전문 지식을 활용하여 중요한 사회적 기여를 하는 동시에, 은퇴 후에도 활동적이고 보람찬 커리어를 유지할 수 있는 기회를 제공합니다. 이러한 진출은 철저한 준비와 지속적인 학습, 그리고 업계와의 활발한 교류를 통해 성공적으로 이루어질 수 있습니다. 정보관리기술사는 취득하는 데에 1년 ~ 3년 정도로 짧지 않은 공부 기간을 요구하지만 IT 개발을 4년 이상 했다면 누구나 합격할 수 있는 100% 암기 시험입니다. 현직에 있을 때 정보관리기술사 자격증을 취득하여 노후를 대비하는 것이 가장 좋지만 지금 은퇴 직전이어도 늦지 않았습니다. 책과 펜만 구매하여 합격한다면 은퇴 후에도 10년은 더 IT 감리와 IT 감사 업계에서 더 근무하실 수 있습니다. IT 감리 업체 평균 연봉은 약 6,500만 원 정도이고 10년을 할 수 있다고 하면 은퇴 이후에도 약 7억 원의 수입을 얻을 수 있습니다. 반면 다른 아르바이트를 한다면 10년 동안 절대 많은 수입을 기대하기 어렵습니다. 정보관리기술사를 취득함으로써 자신의 노후를 대비하는 것은 선택이지만 

https://kmong.com/self-mark[eting/533593/gaPWRhuqHH

[출처] https://gogetem.tistory.com/entry/60%EC%84%B8%EA%B0%80-%EB%84%98%EC%9D%80-IT-%EA%B0%9C%EB%B0%9C%EC%9E%90%EA%B0%80-%EC%9D%80%ED%87%B4-%ED%9B%84%EC%97%90%EB%8F%84-%EA%B3%84%EC%86%8D-%EC%9D%BC%ED%95%98%EB%A9%B0-%EB%85%B8%ED%9B%84%EB%A5%BC-%EB%8C%80%EB%B9%84%ED%95%98%EB%8A%94-%EB%B0%A9%EB%B2%95

Loading

17 3월 2025

[산업] [알아봅시다] 좋은 국비지원 학원 고르는 법 – 실망하지 않으려면? (비전공자 코딩 국비 학원)

[산업] [알아봅시다] 좋은 국비지원 학원 고르는 법 – 실망하지 않으려면? (비전공자 코딩 국비 학원)

01 DALL·E 2025-03-17 01.37.46 - A humorous illustration comparing expectations vs. reality of attending a government-funded coding bootcamp. On the left, a student is excitedly learn.png

좋은 국비지원 학원 고르는 법 – 실망하지 않으려면?


국비지원 학원을 고민하는 많은 분들이 검색하면 가장 많이 접하는 단어 중 하나가 바로 “국비학원 쓰레기” 입니다. 정부 지원을 받아 부담 없이 배울 수 있다는 장점에도 불구하고 왜 이렇게 부정적인 평가가 많을까요?

이 글에서는 실제 사례를 바탕으로 국비지원 학원의 현실적인 문제점을 짚어보고, 좋은 학원을 선택하는 방법에 대해 이야기해보겠습니다.


???? “국비학원 갔다가 시간만 날렸다” – 부실한 커리큘럼과 강사 자질

“프론트엔드를 배우고 싶었는데 HTML, CSS 몇 주 배우다가 갑자기 자바 기본 문법을 배우기 시작했어요. 결국 React는 겨우 맛보기만 하고 끝났습니다.”

많은 수강생들이 커리큘럼과 관련된 불만을 가지고 있습니다. 국비지원 학원의 경우 제한된 예산과 기간 내에 다양한 내용을 가르쳐야 하다 보니, 체계적인 학습이 어렵고 깊이 있는 실무 교육이 부족한 경우가 많습니다.

특히 강사 자질도 중요한 문제입니다. 현업 경험이 풍부한 강사가 아니라 강의 경험만 있는 분들이 수업을 맡는 경우가 많아, 실무에서 어떻게 적용하는지에 대한 노하우를 배우기 어려운 경우가 있습니다.

✔ 어떻게 해결할 수 있을까요?
국비지원 학원을 선택할 때, 과정 개설 전에 강사의 경력과 실제 강의 방식에 대해 미리 확인하는 것이 중요합니다. 가능하다면 수강 후기를 찾아보고, 학원에 직접 방문해서 커리큘럼을 꼼꼼히 살펴보세요.


???? “취업률 90%라고 해서 등록했는데, 다 거짓말이었어요” – 현실적인 취업 연계

국비지원 학원은 취업률을 강조하며 마케팅을 하지만, 현실적으로 수강생들이 원하는 기업에 취업하는 경우는 많지 않습니다.

“취업 연계라고 해서 기대했는데, 결국 제가 직접 구직 사이트에서 공고 찾고 면접 보러 다녀야 했어요.”

이런 사례가 적지 않습니다. 일부 학원은 취업 연계라고 하지만 실제로는 이력서 첨삭이나 모의 면접 같은 기본적인 지원만 제공하는 수준입니다.

또한, 학원에서 연결해주는 기업들은 대부분 규모가 작은 곳이 많아, 연봉이나 근무 환경이 기대에 미치지 못하는 경우도 많습니다.

✔ 어떻게 해결할 수 있을까요?
취업 연계를 강조하는 학원이라면, 어떤 회사들과 실제 협약이 있는지 직접 확인하세요. “우리 학원 수강생들이 많이 간 곳입니다”가 아니라, 공식적인 협력 관계가 있는지를 물어보는 것이 중요합니다.


???? “등록하기 전과 후가 너무 달라요” – 상담 과정에서 주의할 점

국비지원 학원을 상담받으러 가면, 처음에는 굉장히 친절합니다. 하지만 등록을 마친 후부터 태도가 바뀌는 경우가 많습니다.

“처음 상담할 때는 좋은 강사님이 있다고 해서 등록했는데, 수업 시작 후 강사가 바뀌었어요. 중간에 강사 교체가 너무 잦아서 제대로 배운다는 느낌이 안 들었어요.”

또한, 국비지원 과정만으로는 부족하다며 유료 과정을 추가로 등록하도록 유도하는 경우도 많습니다.

✔ 어떻게 해결할 수 있을까요?
상담을 받을 때, 계약서 내용을 꼼꼼히 확인하세요. 국비지원 과정 외에 추가 비용이 발생할 가능성이 있는지, 강사 변경이 빈번한지에 대해 미리 물어보는 것이 중요합니다.


???? 그럼에도 국비지원 학원이 도움이 될 수 있는 경우는?

물론 모든 국비지원 학원이 나쁜 것은 아닙니다. 잘 활용하면 좋은 기회가 될 수도 있습니다.

✅ 국비지원 학원이 도움이 되는 경우

  • 비전공자로서 프로그래밍이나 디자인 등 기초 개념을 익히고 싶은 경우
  • 경제적 부담 없이 체계적인 커리큘럼을 따르고 싶은 경우
  • 혼자 공부하기 어려운 환경에서 강제적으로라도 학습 리듬을 잡고 싶은 경우

❌ 국비지원 학원이 적합하지 않은 경우

  • 이미 기본적인 개념을 알고 있고, 더 깊이 있는 실무 교육을 원한다면
  • 특정 기술을 집중적으로 배우고 싶은데, 수업 내용이 광범위하다면
  • 독학이 가능하고, 자신만의 프로젝트를 만들면서 배울 수 있다면

???? 좋은 국비지원 학원 고르는 법

✔ 커리큘럼을 확인하세요. 원하는 기술이 체계적으로 다뤄지는지 확인해야 합니다.
✔ 강사 경력을 체크하세요. 해당 과정의 강사가 실무 경험이 있는지 알아보세요.
✔ 수강 후기를 찾아보세요. 공식 사이트가 아닌, 실제 수강생들의 후기를 검색해보세요.
✔ 취업 연계 내용을 확인하세요. 실제 어떤 기업들과 협약이 있는지 살펴보세요.
✔ 추가 비용 여부를 확인하세요. 무료 과정 외에 유료 과정 등록을 유도하는지 체크하세요.

 

01_화면_캡처_2025-03-22_165403.png

01_휴먼교육센터_IMG_1814.jpg

Loading

9 3월 2025

[기계학습][머신러닝][딥러닝] 머신러닝 하루 만에 배우려고 하지 마라

[기계학습][머신러닝][딥러닝] 머신러닝 하루 만에 배우려고 하지 마라

머신러닝 하루 만에 배우려고 하지 마라


Source – https://medium.com/designer-hangout/machine-learning-and-ux-c28725b5f3a5

최근 피터 노빅의 “10년 동안 프로그래밍 독학하라”는 멋진 글을 발견했다.

제목이 위트 있으면서도 약간 비꼬는 느낌인데, 프로그래밍을 하루, 일주일, 열흘, 말도 안 되게 짧은 시간만에 익히게 해준다는 허접한 책들을 두고 빈정거리는 것이다.

닥터 노빅은 다음과 같이 분명하게 말한다. 프로그래밍 문법, 원리, 스타일은 하루 만에 익힐 수도 있다. 하지만 그렇다고 해서 프로그래밍 기술을 제대로 사용할 수 있게 되는 것은 아니다. 프로그래밍은 문법이 다가 아니기 때문이다. 프로그래밍이란 코드를 효율적으로 설계하고, 시간과 공간의 복잡성을 철저하게 분석하고, 언제 특정 언어를 사용하는 게 다른 언어를 사용하는 것보다 더 나은지 이해하는 등 다양한 지식을 포괄하는 것이다.

물론 Hello World나 원의 넓이를 구하는 프로그램을 C++로 하루 만에 짤 수도 있겠지만 핵심은 그게 아니다. 당신은 객체 지향 프로그래밍의 관점을 이해하는가? namespaces와 templates를 언제 사용해야 하는지 아는가? STL을 어떻게 사용하는지 아는가? 만약 알고 있다면, 분명 이 모든 것을 일주일 혹은 한 달 만에 익히지는 않았을 것이다. 이런 걸 익히는 데는 시간이 꽤 많이 걸린다. 그리고 알면 알수록, 겉으로 보기보다 더 많은 것들을 알아야 한다는 것을 깨달았을 것이다.

머신러닝, 딥러닝, AI를 둘러싼 전 영역의 분위기에도 이와 비슷한 문제가 있다. 광고, 블로그, 기사, 교육 과정이 도처에 넘쳐난다. 대부분 “코드 일곱 줄로 머신러닝 배우기”, “열흘 만에 배우는 머신러닝” 같은 비슷한 제목을 달고 있다. 이런걸 접한 사람들은 Quora에 “어떻게 하면 머신러닝을 한달 만에 배울수 있을까요?” 같은 질문을 올리게 된다. 짧게 답하자면 “한 달 안에 안된다. 누구도 못한다. 어떤 전문가도 그러지 못했다.”


많이 보던 상황인가? 이 페이스북 페이지에서 찾은 이미지다.

우리가 1만 시간의 법칙을 잠시 잊었다 하더라도, 머신러닝을 코드 일곱 줄로 배울 수는 없다.

왜냐고? 코드 일곱 줄로는 bias-variance tradeoff를 어떻게 처리했는지, 생성된 모델의 accuracy가 무얼 의미하는지, accuracy가 성능을 평가하는데 적절한 지표인지, 모델이 과적합되지는 않았는지, 데이터가 어떤 분포를 띠고 있고 따라서 적합한 모델을 선택했는지 등을 알 수 없기 때문이다. 이 모든 것을 알고 있더라도, 이 밖에 고려해야 할 문제가 훨씬 더 많다.

모델을 해석할 수 없으면 그냥 sklearn으로 파라미터를 조정해서 성능을 좀 향상시킨 다음 기분 좋게 퇴근하면 된다. 하지만 이게 진짜로 머신러닝을 아는 건가?

Source – http://machinelearningjourney.blogspot.in/2012/03/machine-learning-and-memes.html

즉, 코드 일곱 줄로 끝내려고 하면 안 된다. 6개월, 1년 이상 시간을 들여야 한다. 이 기간의 중간쯤 되면 자신이 여기에 흥미가 있는지 아닌지 판단할 수 있게 될 것이다. 화려한 겉모습은 일단 잊어버리고, 깊이 있고 놀라운 연구의 세계로 빠져들어야 한다. 이 글을 꼭 읽어보길 권한다. 초보자에게 가장 많은 도움이 되는 글이다. 수학이나 프로그래밍을 몰라도 된다. 이 글을 읽고 나면 이 분야에 익숙해지려면 알아야 하는, 머신러닝에 관해 생각하고 말하려면 알고 있어야 하는 개념들의 큰 그림을 그릴 수 있게 될 거다.

이 주제와 관련한 훌륭한 블로그들을 소개한다. 이 리스트엔 나의 개인 취향이 반영되어 있다.

  1. http://colah.github.io/
  2. http://mark.reid.name/blog/
  3. http://karpathy.github.io/

Medium도 공부하는데 도움이 많이 된다. 나는 이 페이지를 팔로우하면서 거의 모든 글을 읽고 있다.

만약 당신이 옛날 공부 방식에 익숙하다면, 앤드류 응이 스탠퍼드 대학교에서 강의한 CS229를 들어보라. 앤드류 응이 Coursera에서 했던 강의보다 더 깊이 관여한 강의이고, 개론으로 듣기에 좋다.

과장 광고에 홀려 공부하면 “정보에 빠져 지식에 굶주리는” 불행한 결과를 마주하게 된다. 굉장히 많은 사람이 그런 상황을 겪는다. 우리는 자주 큰 그림을 놓친다. 머신러닝은 훌륭하다. 머신러닝은 하나의 진지한 연구 개발 분야인 동시에 21세기의 수많은 성공 사례들을 이끌고 있다.

하루 만에 배우려고 좀 하지 마라.

여기에서 stellar AI의 연구원인 피터 노빅의 글을 읽을 수 있다. 반드시 읽어봐야 하는 글이다.

진지하게, 왜 안돼?

Yu Zhou에게 감사를 전한다.

이 글은 Rwiddhi Chakraborty의 Don’t learn Machine Learning in 24 hours를 번역한 것입니다. 원문과 대조하여 보려면 링크를 클릭하세요.

[출처] https://github.com/youngwoos/etc/blob/master/Don%E2%80%99t%20learn%20Machine%20Learning%20in%2024%20hours.md

Loading

1 3월 2025

[ 一日30分 인생승리의 학습법] 소프트웨어 개발하다보면 “connection reset” 등, 소프트웨어 버그 적인 문제가아닌 하드웨어나 네트워크 오류 메시지의 예

[ 一日30分 인생승리의 학습법] 소프트웨어 개발하다보면 “connection reset” 등, 소프트웨어 버그 적인 문제가아닌 하드웨어나 네트워크 오류 메시지의 예

소프트웨어 개발하다보면 “connection reset” 등, 소프트웨어 버그 적인 문제가아닌 하드웨어나 네트워크 오류 메시지의 예
DALL·E 2025-03-01 17.05.42 - A digital illustration showing various software and hardware error scenarios in a computer system. The image should include___1. A server room with bl.png
소프트웨어 개발을 하다 보면 프로그램 자체의 버그가 아닌 하드웨어 문제, 네트워크 오류, 시스템 환경 문제 등으로 인해 발생하는 다양한 오류 메시지를 접할 수 있습니다. 대표적인 사례들을 몇 가지 범주로 나누어 설명하겠습니다.

1. 네트워크 및 연결 문제

네트워크 문제는 클라이언트-서버 간 통신 중단, 패킷 손실, 방화벽 설정 오류 등으로 인해 발생합니다.
  • Connection reset by peer
    • 원인: 서버 또는 클라이언트가 연결을 강제로 종료함 (예: 서버가 강제 종료되거나, 클라이언트의 네트워크 장애 발생)
    • 해결: 서버와 클라이언트의 네트워크 상태 확인, 방화벽 설정 점검
  • Connection timed out
    • 원인: 네트워크 응답이 없거나, 방화벽에서 포트 차단
    • 해결: 서버 상태 확인, 네트워크 방화벽 및 라우팅 설정 점검
  • Host unreachable
    • 원인: 대상 서버가 네트워크 상에서 접근 불가능
    • 해결: 서버의 네트워크 설정 확인, 라우팅 문제 해결
  • Broken pipe
    • 원인: TCP 연결이 예상치 않게 끊김 (예: 서버가 클라이언트가 읽기 전에 종료됨)
    • 해결: 클라이언트-서버 연결 안정성 확보, 재시도 로직 추가

2. 디스크 및 파일 시스템 문제

디스크 문제는 파일 저장, 접근 중 발생하는 오류로, 스토리지 장치 상태에 따라 발생할 수 있습니다.
  • No space left on device
    • 원인: 디스크 용량 부족
    • 해결: 불필요한 파일 정리, 디스크 증설
  • Read-only file system
    • 원인: 디스크가 읽기 전용 모드로 변경됨 (예: 파일 시스템 손상으로 자동 마운트됨)
    • 해결: 파일 시스템 체크 (fsck 실행), 마운트 옵션 확인
  • I/O error
    • 원인: 하드웨어 장애 또는 디스크 손상
    • 해결: 디스크 상태 검사 (smartctl 사용), 백업 후 디스크 교체
  • Too many open files (EMFILE)
    • 원인: 프로세스가 동시에 너무 많은 파일을 열어 제한 초과
    • 해결: ulimit -n으로 파일 핸들 개수 증가

3. 메모리 및 CPU 관련 문제

메모리 부족, CPU 과부하로 인해 발생하는 오류 메시지들입니다.
  • Out of memory (OOM Killer activated)
    • 원인: 시스템 메모리가 부족하여 커널이 프로세스를 강제 종료
    • 해결: 메모리 사용량 최적화, 스왑 설정, 필요 시 메모리 증설
  • Segmentation fault (core dumped)
    • 원인: 잘못된 메모리 접근 (일반적으로 소프트웨어 버그, 그러나 하드웨어 문제일 수도 있음)
    • 해결: 코드 디버깅, RAM 상태 점검
  • Bus error
    • 원인: CPU가 접근할 수 없는 메모리 영역에 접근 시 발생
    • 해결: RAM 오류 확인, CPU 상태 점검
  • High CPU Load (load average too high)
    • 원인: CPU 사용률 과부하 (예: 무한 루프, 병목 현상)
    • 해결: tophtop 명령어로 원인 분석 후 코드 최적화

4. 하드웨어 및 장치 오류

서버, 장치, 외부 하드웨어 문제로 인해 발생하는 오류 메시지들입니다.
  • Device not found
    • 원인: 특정 하드웨어(예: USB, GPU)가 인식되지 않음
    • 해결: dmesg 로그 확인, 장치 드라이버 재설치
  • Thermal shutdown
    • 원인: CPU 또는 GPU 온도 과열로 인해 시스템이 강제 종료됨
    • 해결: 냉각 시스템 점검, 서멀 페이스트 재도포
  • Kernel panic – not syncing: Fatal exception in interrupt
    • 원인: 커널 오류 또는 하드웨어 문제
    • 해결: 부팅 로그 확인 (journalctl -xb), RAM 및 디스크 점검

5. 데이터베이스 및 스토리지 문제

데이터베이스가 네트워크, 디스크 문제로 인해 접근 불가능할 때 발생하는 메시지입니다.
  • Lost connection to MySQL server during query
    • 원인: 네트워크 연결 끊김, 데이터베이스 프로세스 종료
    • 해결: 데이터베이스 로그 확인 (/var/log/mysql.log), 네트워크 안정성 점검
  • PostgreSQL: FATAL: the database system is in recovery mode
    • 원인: 데이터베이스가 비정상 종료되어 복구 중
    • 해결: 복구가 끝날 때까지 기다리거나, pg_resetwal 실행
  • MongoDB: WiredTiger error (-31804) [timestamp]: WT_PANIC: fatal WiredTiger error
    • 원인: 스토리지 손상 또는 데이터 손실
    • 해결: 백업에서 복구, mongod --repair 실행

이와 같은 오류 메시지들은 주로 소프트웨어 자체의 버그가 아닌 네트워크, 디스크, 메모리, CPU, 하드웨어 문제로 인해 발생하는 경우입니다. 문제를 해결하려면 시스템 로그(dmesgjournalctlsyslog)를 확인하고, 하드웨어 상태를 점검하는 것이 중요합니다.
 
 
 
 
 

Loading