bob changed the file names of the invoice PDFs
authorgregor herrmann <gregoa@debian.org>
Thu, 14 Jul 2016 03:00:51 +0000 (05:00 +0200)
committergregor herrmann <gregoa@debian.org>
Thu, 14 Jul 2016 03:00:51 +0000 (05:00 +0200)
s/Rechnungskopie/Rechnung/

bob_download.py

index 70187ed1ae4f59af5b2346589a6a854918355a66..5c67bcde2f661cf2af3313ae7c4c52eb7ae46f6f 100755 (executable)
@@ -56,21 +56,21 @@ def main(username, password, destdir, csv_format):
 
     # reload overview page rechnung.bob.at - that makes the URLs in the page much prettier
     # previously:
-    # https://rechnung.bob.at/bill/pdf/;BOBOBPSESSIONID=B7DB9938A3B9541E3D0EB6CD728F54C0.obpBobCustomer4Rechnungskopie_1509_523260091_1.pdf?bsn=61
+    # https://rechnung.bob.at/bill/pdf/;BOBOBPSESSIONID=773A62BEC4AE1FBB917B3D82F69CE3A4.obpBobCustomer4Rechnung_1606_518139490_1.pdf?bsn=108
     # same after reload:
-    # '/bill/pdf/Rechnungskopie_1509_523260091_1.pdf?bsn=61'
+    # '/bill/pdf/Rechnung_1606_518139490_1.pdf?bsn=107'
     response = session.get(response.url)
     assert response.ok
     html = BeautifulSoup(response.text, 'html.parser')
 
     # Download PDFs
-    # Links look like '/bill/pdf/Rechnungskopie_1509_523260091_1.pdf?bsn=61'
-    regexp = re.compile(r'\/(Rechnungskopie_.*)\?')
+    # Links look like '/bill/pdf/Rechnung_1606_518139490_1.pdf?bsn=107'
+    regexp = re.compile(r'\/(Rechnung_.*)\?')
     links = html.findAll('a', href=regexp)
     for link in links:
         url = link['href']
         filename = regexp.search(url).group(1)
-        assert filename.startswith('Rechnungskopie_')
+        assert filename.startswith('Rechnung_')
         filepath = os.path.join(destdir, filename)
         if not os.path.exists(filepath):
             response = session.get(urljoin(response.url, url))