Welcome to Scribd!

Hindu Customized Recipe

Uploaded by

0% found this document useful (0 votes)

2K views2 pages

This document defines a class called TheHindu that customizes a news feed recipe for the Indian newspaper The Hindu. The class parses the newspaper's index page to extract section titles and article URLs, filters out articles from omitted sections, and returns a list of section feeds where each feed contains a section title and list of article dictionaries. It also defines an is_accepted_entry method to check if a navigation entry should be included or omitted based on a blacklist.

Original Description:

The hindu - customized recipe for calibre.

Copyright

Available Formats

TXT, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as TXT, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as txt, pdf, or txt

0% found this document useful (0 votes)

2K views2 pages

Hindu Customized Recipe

Uploaded by

Ankur Verma

Copyright:

Available Formats

Download as TXT, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as txt, pdf, or txt

Jump to Page

You are on page 1of 2

Search inside document

from future import with_statement

license = 'GPL 3'

__copyright__ = '2009, Kovid Goyal <kovid@kovidgoyal.net>'
from calibre.web.feeds.news import BasicNewsRecipe
import string
class TheHindu(BasicNewsRecipe):
title = u'The Hindu - Customized'
language = 'en_IN'
oldest_article = 1
__author__ = 'Ankurs Calibre'
max_articles_per_feed = 100
no_stylesheets = True
auto_cleanup = True
extra_css = '.photo-caption { font-size: smaller }'
def parse_index(self):
soup = self.index_to_soup('http://www.thehindu.com/todays-paper/')
nav_div = soup.find(id='tpnav-bar')
section_list = []
# Finding all the section titles that are acceptable
for x in nav_div.findAll(['a']):
if self.is_accepted_entry(x):
section_list.append(
(string.capwords(self.tag_to_string(x)), x['href']))
# For each section title, fetch the article urls
feeds = []
for section in section_list:
section_title = section[0]
section_url = section[1]
soup = self.index_to_soup(section_url)
current_articles = []
div = soup.find('div', attrs={'id': 'left-column'})
soup.find('span', attrs={'class': 'newsection-title'}).extract()
soup.find('div', attrs={'id': 'tpnav-bar'}).extract()
for x in div.findAll(['a']):
title = self.tag_to_string(x)
url = x.get('href', False)
if not url or not title:
continue
self.log('\t\tFound article:', title)
self.log('\t\t\t', url)
current_articles.append({'title': title, 'url': url,
'description': '', 'date': ''})
feeds.append((section_title, current_articles))
return feeds
def is_accepted_entry(self, entry):
# Those sections in the top nav bar that we will omit

omit_list = ['tp-tamilnadu',
'tp-karnataka',
'tp-telangana',
'tp-kerala',
'tp-andhrapradesh',
'tp-in-school',
'tp-cinemaplus',
'tp-propertyplus',
'tp-downtown',
'tp-agriculture',
'tp-openpage']
is_accepted = True
for omit_entry in omit_list:
if entry['href'][0:-1].endswith(omit_entry):
is_accepted = False
break
return is_accepted

WSMA Lab Manual 2
Document8 pages
WSMA Lab Manual 2
Ashish Kurapathi
No ratings yet
Digging Into The WordPress by Customizer
Document58 pages
Digging Into The WordPress by Customizer
Vidya Mishra
100% (1)
GTI Backend Test
Document8 pages
GTI Backend Test
unuha26
No ratings yet
Lab Building Simple Shopping Cart Using Python, Flask, MySQL
Document14 pages
Lab Building Simple Shopping Cart Using Python, Flask, MySQL
Joker Jr
No ratings yet
Flask Deployment Doc - Amen
Document3 pages
Flask Deployment Doc - Amen
santhiyasantthosh
No ratings yet
Scrapy
Document1 page
Scrapy
Rayees Rasheed
No ratings yet
How To Test With Simple HTML Tags Using Beautifulsoup
Document5 pages
How To Test With Simple HTML Tags Using Beautifulsoup
nafisa salim
No ratings yet
Week 5 Assignment Nov
Document7 pages
Week 5 Assignment Nov
mahhipc
No ratings yet
Assignment: Department of Computer Science & Engineering ST Joseph Engineering College, Mangaluru-575028
Document28 pages
Assignment: Department of Computer Science & Engineering ST Joseph Engineering College, Mangaluru-575028
Akul Vinod
No ratings yet
BHW Code
Document3 pages
BHW Code
Stefan Mihai Bitai
No ratings yet
Object Oriented Programming
Document10 pages
Object Oriented Programming
Jamila Noor
No ratings yet
System Stats
Document2 pages
System Stats
JamaicaMom Mom
No ratings yet
The Django Model Cheat Sheet
Document2 pages
The Django Model Cheat Sheet
windoze007
100% (12)
Assignment 9 Utkarsh
Document5 pages
Assignment 9 Utkarsh
bubunkumar84
No ratings yet
25 Extremely Useful Tricks For The WordPress Functions File
Document19 pages
25 Extremely Useful Tricks For The WordPress Functions File
Raglean Cristian
No ratings yet
Create Blog Post Models With Django 3.1 - Django Tutorial 2020
Document10 pages
Create Blog Post Models With Django 3.1 - Django Tutorial 2020
Mario Colosso V.
No ratings yet
Is A Life Cycle Hook Called by Angular To Indicate That Angular Is Done Creating The Component
Document6 pages
Is A Life Cycle Hook Called by Angular To Indicate That Angular Is Done Creating The Component
Shantanu Kaluse
No ratings yet
ENGR 101 Introduction To Programming: Week 13
Document28 pages
ENGR 101 Introduction To Programming: Week 13
hudhaifa
No ratings yet
Views - Py Forlder
Document8 pages
Views - Py Forlder
Mufid
No ratings yet
75 Python Object Oriented Progr - Learning, Edcorner
Document112 pages
75 Python Object Oriented Progr - Learning, Edcorner
Anael Santos dos Reis
No ratings yet
Rails Best Practices: As This Slide Writing, The Current Rails Version Is 2.3.4
Document99 pages
Rails Best Practices: As This Slide Writing, The Current Rails Version Is 2.3.4
justin1983
No ratings yet
Functions - PHP File From Your Theme. If That File Doesn't Exists, Create It
Document53 pages
Functions - PHP File From Your Theme. If That File Doesn't Exists, Create It
garfield137
100% (1)
6 To 10
Document10 pages
6 To 10
shrinidhi N
No ratings yet
Django Simple CRUD
Document21 pages
Django Simple CRUD
ivan sugiarto
No ratings yet
BackOffice NG
Document28 pages
BackOffice NG
Mukesh
100% (1)
4 - Authentication and Permissions - Django REST Framework
Document7 pages
4 - Authentication and Permissions - Django REST Framework
Prince Takyi Arthur
No ratings yet
Cabico Tan
Document11 pages
Cabico Tan
jaydee cabico
No ratings yet
Backend Expense
Document5 pages
Backend Expense
lukmanolamide001
No ratings yet
Flask Blog
Document24 pages
Flask Blog
stephen kimeu
No ratings yet
4 - Authentication and Permissions - Django REST Framework
Document7 pages
4 - Authentication and Permissions - Django REST Framework
thanhlong05.06.2k
No ratings yet
Installation Guide of Pos Module
Document9 pages
Installation Guide of Pos Module
Codeclouds Technologies
No ratings yet
Digest
Document1 page
Digest
Yady
No ratings yet
Django: A High-Level Python Web Framework That Encourages Rapid Development and Clean, Pragmatic Design
Document109 pages
Django: A High-Level Python Web Framework That Encourages Rapid Development and Clean, Pragmatic Design
alina75101
No ratings yet
Python
Document18 pages
Python
Muskan Gupta
No ratings yet
cnpm2.05 LeManhCuong Baitap4.v2
Document28 pages
cnpm2.05 LeManhCuong Baitap4.v2
Vu Xuan Hoai
No ratings yet
Model and DB Creation
Document2 pages
Model and DB Creation
Saiteja puli544
No ratings yet
ENGR 101 Introduction To Programming: Week 14
Document48 pages
ENGR 101 Introduction To Programming: Week 14
Antep Fıstık Sepeti
No ratings yet
Read Latest PHP Codeigniter Interview Questions From Below: Explain What Is Codeigniter?
Document11 pages
Read Latest PHP Codeigniter Interview Questions From Below: Explain What Is Codeigniter?
Er Rahul Boghara
No ratings yet
Denis Ivy: Tutorial 01
Document6 pages
Denis Ivy: Tutorial 01
ritesh
No ratings yet
Create Multiple Thumbnails at Once in Codeigniter
Document31 pages
Create Multiple Thumbnails at Once in Codeigniter
Abdul Syukur
No ratings yet
Cloud Natural Language
Document1 page
Cloud Natural Language
Denys Stolbov
No ratings yet
CODE - Python How To Use Celery and RabbitMQ With Django
Document14 pages
CODE - Python How To Use Celery and RabbitMQ With Django
Armando Regino Romero Perez
No ratings yet
Digging Into Wordpress
Document9 pages
Digging Into Wordpress
testdungpt
No ratings yet
Django Notes: To Create A New Project
Document7 pages
Django Notes: To Create A New Project
devfaz
No ratings yet
6 CodeIgniter Hacks For The Masters
Document17 pages
6 CodeIgniter Hacks For The Masters
sinyo2104
No ratings yet
Build Microservices With Python. This Article Aims To Outline The Basics - by Ashish MJ - Dev Genius
Document22 pages
Build Microservices With Python. This Article Aims To Outline The Basics - by Ashish MJ - Dev Genius
walteravelin
No ratings yet
Django Crud FBV CBV Orm Notes v1
Document32 pages
Django Crud FBV CBV Orm Notes v1
selemondoc
No ratings yet
IP Project File CYBER CAFE MANAGEMENT
Document27 pages
IP Project File CYBER CAFE MANAGEMENT
Piyush Gola
No ratings yet
Ruby On Rails Quiz - MD
Document21 pages
Ruby On Rails Quiz - MD
Willy Wanka
No ratings yet
Symfony 2 Poster
Document1 page
Symfony 2 Poster
leobally
No ratings yet
Anvil - Code For Chatbot
Document5 pages
Anvil - Code For Chatbot
Bâbú Sheelaj
No ratings yet
Starting Your Next: Scraping Project
Document7 pages
Starting Your Next: Scraping Project
Lisa Simpsons
No ratings yet
ABAP ALV Tree Exemplo
Document13 pages
ABAP ALV Tree Exemplo
Leonardo Nobre
No ratings yet
MCQ3 15th
Document71 pages
MCQ3 15th
DONA MONDAL
No ratings yet
Untitled Document
Document46 pages
Untitled Document
Gopal Jha
No ratings yet
Gce Requirements
Document4 pages
Gce Requirements
Matthew Harris
No ratings yet
C++ Exam Past Question and Answer
Document8 pages
C++ Exam Past Question and Answer
goodluckjacob206
No ratings yet
Customizing The Divi WordPress Theme - Calcatraz
Document75 pages
Customizing The Divi WordPress Theme - Calcatraz
BobexStojanovic
100% (1)
Laravel Tips 2019 04
Document24 pages
Laravel Tips 2019 04
Fredy Giovanny Calle
No ratings yet
50 Recipes for Programming Angular
From Everand
50 Recipes for Programming Angular
Jamie Munro
Rating: 4 out of 5 stars
4/5 (1)