OSDN Git Service

Add some fundamental functions for thread and small html parser
[fukui-no-namari/fukui-no-namari.git] / src / Hage1 / datfile.py
1 # Copyright (C) 2006 by Aiwota Programmer
2 # aiwotaprog@tetteke.tk
3 #
4 # This program is free software; you can redistribute it and/or modify
5 # it under the terms of the GNU General Public License as published by
6 # the Free Software Foundation; either version 2 of the License, or
7 # (at your option) any later version.
8 #
9 # This program is distributed in the hope that it will be useful,
10 # but WITHOUT ANY WARRANTY; without even the implied warranty of
11 # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12 # GNU General Public License for more details.
13 #
14 # You should have received a copy of the GNU General Public License
15 # along with this program; if not, write to the Free Software
16 # Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA  02110-1301  USA
17
18 import re
19 import os.path
20 import codecs
21
22 import misc
23
24 REG_EXPR_TITLE = re.compile(".*<>.*<>.*<>.*<>(.*)")
25 REG_EXPR_ELEM = re.compile( \
26     "(?P<name>.*)<>(?P<mail>.*)<>(?P<date>.*)<>(?P<msg>.*)<>")
27
28 def get_title_from_dat(bbs, board, thread):
29     """Returns thread title in dat file
30
31     bbs: bbs id
32
33     board: board id
34
35     thread: thread id
36
37     If failed, return None
38     """
39     dat_path = misc.get_thread_dat_path(bbs, board, thread)
40     if not os.path.exists(dat_path):
41         return None
42
43     f = open(dat_path, "r")
44     try:
45         line = f.readline()
46         if line:
47             m = REG_EXPR_TITLE.match(line.decode("cp932", "replace"))
48             if m:
49                 return m.group(1)
50     finally:
51         f.close()
52
53 def split_line_to_elems(line, func):
54     """Splits a line to elements and invokes func
55
56     line: represents one res
57
58     func: is invoked after splitting
59     format of user functon is:
60     def some_func(name, mail, date, msg):
61     where parameters represent corresponding elements of the res
62     """
63     m = REG_EXPR_ELEM.match(line)
64     if m:
65         name = m.group("name")
66         mail = m.group("mail")
67         date = m.group("date")
68         msg = m.group("msg")
69         func(name, mail, date, msg)
70
71 def load_dat(bbs, board, thread, func):
72     """Loads entire dat and invokes func per one res
73
74     bbs: bbs id
75
76     board: board id
77
78     thread: thread id
79
80     func: is invoked per one res
81     format of user function is:
82     def some_func(num, line):
83     where num is the number of the res and line is raw body of the res
84     """
85     dat_path = misc.get_thread_dat_path(bbs, board, thread)
86     if not os.path.exists(dat_path):
87         return
88
89     f = open(dat_path, "r")
90     num = 1
91     try:
92         line = f.readline()
93         while line:
94             line = line.decode("cp932", "replace")
95             func(num, line)
96             line = f.readline()
97             num += 1
98     finally:
99         f.close()