[엑셀로 웹 스크래핑3] Excel VBA Web Scraping Tutorial

A couple months ago I published an article on UK industry analysis–based on first principles analysis using historical FTSE share price data. At the end of this article is the code I used to extract Yahoo! share price data from their website.

You can follow the guidance below for instructions on how to perform the scrape and cache the data; but this video provides a quick demonstration of the tool.

To utilize the code at the end of this article follow the steps below (or just download the EXCEL FILE itself and take a look).

  1. Open Excel, name a sheet ‘l_finance’ and into it paste a list of ticker symbols starting in cell A1 (no blank rows!) whose historical share price data you want to extract.
  2. Next hit Alt + F11 to open the VBA editor.
  3. Paste all of the code below into the editor and click F5 to run the subroutine.
  4. After hitting F5, wait a minute or two (don’t mess with Excel while the code is working!) and your data is cached in a workbook called ‘yhcacheYYYYMM.xlsx’ (in the same folder as your workbook you pasted the code into).
  5. You can then graph it, put it in pivot tables, move to Access, SQL Server, SAS, or other analysis tool and analyse.
  6. Below is what your screen should look like after pasting the code into Excel.
excel web scraping vba
Excel web scraping vba pasted into the code editor

The routine above basically loops through a list of given symbols, and for each symbol it opens the relevant Yahoo Finance historic share price page, retrieves the associated price data for the company, then fires it into a data cache (i.e. a worksheet) in Excel. Once the routine was up and running it took about two minutes to run… not bad, I thought, for 5yrs of monthly closing share price data for 100 companies. When I get more time I will use this basic web scrape technique to analyse a broader range of industry share price trends.

The article showing share price trends across all UK FTSE100 industries for the past five years is located HERE. The exercise used monthly share price data from Yahoo Finance. That data is free, courtesy of Yahoo, but it is only retrievable one company at a time on their website.

경축! 아무것도 안하여 에스천사게임즈가 새로운 모습으로 재오픈 하였습니다.
어린이용이며, 설치가 필요없는 브라우저 게임입니다.
https://s1004games.com

 

Excel Web Scraper Code: Yahoo Finance Data

Sub d_yhprices()
'routine for executing repeated web queries on yahoo finance webpage to get 5yrs monthly data for a defined ticker list

Dim rg1, rg2, rg3 As Range
Dim bk1, bk2, bk3 As Workbook
Dim sht1, sht2, sht3 As Worksheet
Dim qtb As New QueryTable
Dim url1, path1, tkr As String
Dim r1, r2, r3 As Long
Dim t2 As Date

'initiate ticker range and cache repository workbook
Set sht1 = ThisWorkbook.Sheets("l_finance")
r1 = sht1.Range("a1").End(xlDown).Row
Set bk3 = Workbooks.Add
Set sht3 = bk3.Sheets(1)

'loop through ticker symbols to extract and cache data
For i = 2 To r1
 tkr = sht1.Range("a" & i)
 url1 = "http://finance.yahoo.com/q/hp?s=" & tkr & "&a=00&b=2&c=1980&d=11&e=17&f=2014&g=m" 'note the date range and periodicity on the end of this string
 
 Set bk2 = Workbooks.Add
 Set sht2 = bk2.Sheets(1)
 
 'extract web table to temp bk
 Set qtb = sht2.QueryTables.Add(Connection:="URL;" & url1, Destination:=Range("$A37300"))
 qtb.WebFormatting = xlWebFormattingNone
 qtb.WebTables = "15"
 qtb.Refresh BackgroundQuery:=False
 'Application.Wait (Now + #12:00:05 AM#)
 
 r2 = sht2.Range("a1").End(xlDown).Row
 sht2.Range("a:a").Insert
 sht2.Range("a1") = "ticker"
 sht2.Range("a2:a" & r2) = tkr
 
 'export to cache then discard bk2
 sht2.Range("a1").CurrentRegion.Copy
 r3 = sht3.Range("a1048576").End(xlUp).Row + 1
 sht3.Range("a" & r3).PasteSpecial xlPasteValues
 Application.CutCopyMode = False
 bk2.Close False
Next i

path1 = ThisWorkbook.Path & "yhcache" & Format(Date, "yyyymm") & ".xlsx"
bk3.SaveAs (path1)
bk3.Close

MsgBox ("finished caching stock price data!")

End Sub

Did you try this out? How did it go? Do you know how to do this properly using C# or vb.net?… feel free to share your comments below.

 

[출처] http://analyze6.com/excel-vba/excel-vba-web-scraping-tutorial/

본 웹사이트는 광고를 포함하고 있습니다.
광고 클릭에서 발생하는 수익금은 모두 웹사이트 서버의 유지 및 관리, 그리고 기술 콘텐츠 향상을 위해 쓰여집니다.
번호 제목 글쓴이 날짜 조회 수
1195 [ 一日30分 인생승리의 학습법] VBA Web Scraping: How Can VBA Be Used To Scrape Website Data? file 졸리운_곰 2024.04.13 3
1194 [ 一日30分 인생승리의 학습법] 윈도우 실행파일 구조(PE파일) file 졸리운_곰 2024.03.31 3
1193 [ 一日30分 인생승리의 학습법] [Analysis] PE(Portable Executable) 파일 포맷 공부 file 졸리운_곰 2024.03.31 3
1192 [ 一日30分 인생승리의 학습법] 성공하는 메타버스의 3가지 조건 file 졸리운_곰 2024.03.30 7
1191 [ 一日30分 인생승리의 학습법] REST, REST API, RESTful 과 HATEOAS file 졸리운_곰 2024.03.10 9
1190 [ 一日30分 인생승리의 학습법] 렌더링 삼형제 CSR, SSR, SSG 이해하기 file 졸리운_곰 2024.03.10 2
1189 [ 一日30分 인생승리의 학습법] 엑셀 VBA에서 셀레니움 사용을 위한 Selenium Basic 설치 file 졸리운_곰 2024.02.23 11
1188 [ 一日30分 인생승리의 학습법]500 Lines or Less Blockcode: A Visual Programming Toolkit : 500줄 이하의 블록코드: 시각적 프로그래밍 툴킷 졸리운_곰 2024.02.12 4
1187 [ 一日30分 인생승리의 학습법] 구글 클라이언트(앱) 아이디를 발급받으려면 어떻게 해야 하나요? 졸리운_곰 2024.01.28 3
1186 [ 一日30分 인생승리의 학습법] 빅뱅 프로젝트를 성공적으로 오픈하기 위한 팁 졸리운_곰 2023.12.27 16
1185 [ 一日30分 인생승리의 학습법]“빅뱅 전환보다 단계적 전환 방식이 이상적 애자일팀과 협업 쉽게 체질 개선을” file 졸리운_곰 2023.12.27 12
1184 [ 一日30分 인생승리의 학습법] Big-bang / phased 접근 file 졸리운_곰 2023.12.27 3
1183 [ 一日30分 인생승리의 학습법] CodeDragon 메뉴 데이터 전환의 개념 이해 - 데이터 전환의 개념, 데이터 전환방식, 데이터 전환방식 및 장단점 비교, 데이터전환 이후 검토해야 할 사항 졸리운_곰 2023.12.27 5
1182 [ 一日30分 인생승리의 학습법] 블록체인과 IPFS를 이용한 안전한 데이터 공유 플랫폼 - 분쟁 해결 시스템 file 졸리운_곰 2023.12.27 6
1181 [ 一日30分 인생승리의 학습법] 블록체인과 IPFS를 이용한 안전한 데이터 공유 플랫폼 - 개념과 리뷰 시스템 file 졸리운_곰 2023.12.27 4
1180 [ 一日30分 인생승리의 학습법] 소켓 CLOSE_WAIT 발생 현상 및 처리 방안 file 졸리운_곰 2023.12.03 7
1179 [ 一日30分 인생승리의 학습법] robots 설정하기 졸리운_곰 2023.12.03 3
1178 [ 一日30分 인생승리의 학습법] A Tutorial and Elementary Trajectory Model for the Differential Steering System of Robot Wheel Actuators : 로봇 휠 액츄에이터의 차동 조향 시스템에 대한 튜토리얼 및 기본 궤적 모델 file 졸리운_곰 2023.11.29 6
1177 [ 一日30分 인생승리의 학습법] Streamline Your MLOps Journey with CodeProject.AI Server : CodeProject.AI 서버로 MLOps 여정을 간소화하세요 file 졸리운_곰 2023.11.25 2
1176 [ 一日30分 인생승리의 학습법] Comparing Self-Hosted AI Servers: A Guide for Developers / : 자체 호스팅 AI 서버 비교: 개발자를 위한 가이드 file 졸리운_곰 2023.11.25 10
대표 김성준 주소 : 경기 용인 분당수지 U타워 등록번호 : 142-07-27414
통신판매업 신고 : 제2012-용인수지-0185호 출판업 신고 : 수지구청 제 123호 개인정보보호최고책임자 : 김성준 sjkim70@stechstar.com
대표전화 : 010-4589-2193 [fax] 02-6280-1294 COPYRIGHT(C) stechstar.com ALL RIGHTS RESERVED