OSDN Git Service

Don't let an invalid PES header length (from a corrupted packet) cause us to crash...
[handbrake-jp/handbrake-jp-git.git] / libhb / stream.c
1 /* $Id$
2
3    This file is part of the HandBrake source code.
4    Homepage: <http://handbrake.fr/>.
5    It may be used under the terms of the GNU General Public License. */
6
7 #include <string.h>
8 #include <ctype.h>
9 #include <errno.h>
10
11 #include "hb.h"
12 #include "hbffmpeg.h"
13 #include "lang.h"
14 #include "a52dec/a52.h"
15 #include "mp4v2/mp4v2.h"
16
17 #define min(a, b) a < b ? a : b
18
19 /*
20  * This table defines how ISO MPEG stream type codes map to HandBrake
21  * codecs. It is indexed by the 8 bit stream type and contains the codec
22  * worker object id and a parameter for that worker proc (ignored except
23  * for the ffmpeg-based codecs in which case it is the ffmpeg codec id).
24  *
25  * Entries with a worker proc id of 0 or a kind of 'U' indicate that HB
26  * doesn't handle the stream type.
27  */
28 typedef struct {
29     enum { N, U, A, V } kind; /* not handled / unknown / audio / video */
30     int codec;          /* HB worker object id of codec */
31     int codec_param;    /* param for codec (usually ffmpeg codec id) */
32     const char* name;   /* description of type */
33 } stream2codec_t;
34
35 #define st(id, kind, codec, codec_param, name) \
36  [id] = { kind, codec, codec_param, name }
37
38 static const stream2codec_t st2codec[256] = {
39     st(0x01, V, WORK_DECMPEG2,     0,              "MPEG1"),
40     st(0x02, V, WORK_DECMPEG2,     0,              "MPEG2"),
41     st(0x03, A, HB_ACODEC_MPGA,    CODEC_ID_MP2,   "MPEG1"),
42     st(0x04, A, HB_ACODEC_MPGA,    CODEC_ID_MP2,   "MPEG2"),
43     st(0x05, N, 0,                 0,              "ISO 13818-1 private section"),
44     st(0x06, U, 0,                 0,              "ISO 13818-1 PES private data"),
45     st(0x07, N, 0,                 0,              "ISO 13522 MHEG"),
46     st(0x08, N, 0,                 0,              "ISO 13818-1 DSM-CC"),
47     st(0x09, N, 0,                 0,              "ISO 13818-1 auxiliary"),
48     st(0x0a, N, 0,                 0,              "ISO 13818-6 encap"),
49     st(0x0b, N, 0,                 0,              "ISO 13818-6 DSM-CC U-N msgs"),
50     st(0x0c, N, 0,                 0,              "ISO 13818-6 Stream descriptors"),
51     st(0x0d, N, 0,                 0,              "ISO 13818-6 Sections"),
52     st(0x0e, N, 0,                 0,              "ISO 13818-1 auxiliary"),
53     st(0x0f, A, HB_ACODEC_MPGA,    CODEC_ID_AAC,   "ISO 13818-7 AAC Audio"),
54     st(0x10, V, WORK_DECAVCODECV,  CODEC_ID_MPEG4, "MPEG4"),
55     st(0x11, A, HB_ACODEC_MPGA,    CODEC_ID_AAC_LATM, "MPEG4 LATM AAC"),
56     st(0x12, U, 0,                 0,              "MPEG4 generic"),
57
58     st(0x14, N, 0,                 0,              "ISO 13818-6 DSM-CC download"),
59
60     st(0x1b, V, WORK_DECAVCODECV,  CODEC_ID_H264,  "H.264"),
61
62     st(0x80, N, 0,                 0,              "DigiCipher II Video"),
63     st(0x81, A, HB_ACODEC_AC3,     0,              "AC-3"),
64     st(0x82, A, HB_ACODEC_DCA,     0,              "HDMV DTS"),
65     st(0x83, A, HB_ACODEC_LPCM,    0,              "LPCM"),
66     st(0x84, A, 0,                 0,              "SDDS"),
67     st(0x85, U, 0,                 0,              "ATSC Program ID"),
68     st(0x86, A, HB_ACODEC_DCA,     0,              "DTS-HD"),
69     st(0x87, A, 0,                 0,              "E-AC-3"),
70
71     st(0x8a, A, HB_ACODEC_DCA,     0,              "DTS"),
72
73     st(0x91, A, HB_ACODEC_AC3,     0,              "AC-3"),
74     st(0x92, N, 0,                 0,              "Subtitle"),
75
76     st(0x94, A, 0,                 0,              "SDDS"),
77     st(0xa0, V, 0,                 0,              "MSCODEC"),
78
79     st(0xea, V, WORK_DECAVCODECV,  CODEC_ID_VC1,   "VC1"),
80 };
81 #undef st
82
83 typedef enum {
84     hb_stream_type_unknown = 0,
85     transport,
86     program,
87     dvd_program,
88     ffmpeg
89 } hb_stream_type_t;
90
91 #define kMaxNumberVideoPIDS 1
92 #define kMaxNumberAudioPIDS 15
93 #define kMaxNumberDecodeStreams (kMaxNumberVideoPIDS+kMaxNumberAudioPIDS)
94 #define kMaxNumberPMTStreams 32
95
96
97 struct hb_stream_s
98 {
99     int     frames;             /* video frames so far */
100     int     errors;             /* total errors so far */
101     int     last_error_frame;   /* frame # at last error message */
102     int     last_error_count;   /* # errors at last error message */
103     int     packetsize;         /* Transport Stream packet size */
104
105     uint8_t need_keyframe;      // non-zero if want to start at a keyframe
106     uint8_t ts_found_pcr;       // non-zero if we've found at least one input pcr
107     int     ts_pcr_out;         // sequence number of most recent output pcr
108     int     ts_pcr_in;          // sequence number of most recent input pcr
109     int64_t ts_pcr;             // most recent input pcr
110     int64_t ts_pcrhist[4];      // circular buffer of output pcrs
111
112     uint8_t *ts_packet;         /* buffer for one TS packet */
113     hb_buffer_t *ts_buf[kMaxNumberDecodeStreams];
114     int     ts_pos[kMaxNumberDecodeStreams];
115     int8_t  ts_skipbad[kMaxNumberDecodeStreams];
116     int8_t  ts_streamcont[kMaxNumberDecodeStreams];
117
118     hb_buffer_t *fwrite_buf;      /* PS buffer (set by hb_ts_stream_decode) */
119
120     int      chapter;           /* Chapter that we are currently in */
121     uint64_t chapter_end;       /* HB time that the current chapter ends */
122
123     /*
124      * Stuff before this point is dynamic state updated as we read the
125      * stream. Stuff after this point is stream description state that
126      * we learn during the initial scan but cache so it can be
127      * reused during the conversion read.
128      */
129     uint8_t ts_number_video_pids;
130     uint8_t ts_number_audio_pids;
131     uint8_t ts_flags;           // stream characteristics:
132 #define         TS_HAS_PCR  (1 << 0)    // at least one PCR seen
133 #define         TS_HAS_RAP  (1 << 1)    // Random Access Point bit seen
134 #define         TS_HAS_RSEI (1 << 2)    // "Restart point" SEI seen
135     uint8_t ts_IDRs;            // # IDRs found during duration scan
136
137     int16_t ts_video_pids[kMaxNumberVideoPIDS];
138     int16_t ts_audio_pids[kMaxNumberAudioPIDS];
139
140     uint32_t ts_format_id[kMaxNumberDecodeStreams];
141 #define TS_FORMAT_ID_AC3 (('A' << 24) | ('C' << 16) | ('-' << 8) | '3')
142     uint8_t ts_stream_type[kMaxNumberDecodeStreams];
143     uint8_t ts_multiplexed[kMaxNumberDecodeStreams];
144
145     char    *path;
146     FILE    *file_handle;
147     hb_stream_type_t hb_stream_type;
148     hb_title_t *title;
149
150     AVFormatContext *ffmpeg_ic;
151     AVPacket *ffmpeg_pkt;
152     double ffmpeg_tsconv[MAX_STREAMS];
153     uint8_t ffmpeg_video_id;
154
155     struct {
156         int lang_code;
157         int flags;
158         int rate;
159         int bitrate;
160     } a52_info[kMaxNumberAudioPIDS];
161
162     struct
163     {
164         unsigned short program_number;
165         unsigned short program_map_PID;
166     } pat_info[kMaxNumberPMTStreams];
167     int     ts_number_pat_entries;
168
169     struct
170     {
171         int reading;
172         unsigned char *tablebuf;
173         unsigned int tablepos;
174         unsigned char current_continuity_counter;
175
176         int section_length;
177         int program_number;
178         unsigned int PCR_PID;
179         int program_info_length;
180         unsigned char *progam_info_descriptor_data;
181         struct
182         {
183             unsigned char stream_type;
184             unsigned short elementary_PID;
185             unsigned short ES_info_length;
186             unsigned char *es_info_descriptor_data;
187         } pmt_stream_info[kMaxNumberPMTStreams];
188     } pmt_info;
189 };
190
191 /***********************************************************************
192  * Local prototypes
193  **********************************************************************/
194 static void hb_stream_duration(hb_stream_t *stream, hb_title_t *inTitle);
195 static void hb_ts_stream_init(hb_stream_t *stream);
196 static void hb_ts_stream_find_pids(hb_stream_t *stream);
197 static int hb_ts_stream_decode(hb_stream_t *stream, hb_buffer_t *obuf);
198 static void hb_ts_stream_reset(hb_stream_t *stream);
199 static hb_audio_t *hb_ts_stream_set_audio_id_and_codec(hb_stream_t *stream,
200                                                        int aud_pid_index);
201 static void hb_ps_stream_find_audio_ids(hb_stream_t *stream, hb_title_t *title);
202 static off_t align_to_next_packet(hb_stream_t *stream);
203
204 static int ffmpeg_open( hb_stream_t *stream, hb_title_t *title );
205 static void ffmpeg_close( hb_stream_t *d );
206 static hb_title_t *ffmpeg_title_scan( hb_stream_t *stream );
207 static int ffmpeg_read( hb_stream_t *stream, hb_buffer_t *buf );
208 static int ffmpeg_seek( hb_stream_t *stream, float frac );
209
210 /*
211  * streams have a bunch of state that's learned during the scan. We don't
212  * want to throw away the state when scan does a close then relearn
213  * everything when reader does an open. So we save the stream state on
214  * the close following a scan and reuse it when 'reader' does an open.
215  */
216 static hb_list_t *stream_state_list;
217
218 static hb_stream_t *hb_stream_lookup( const char *path )
219 {
220     if ( stream_state_list == NULL )
221         return NULL;
222
223     hb_stream_t *ss;
224     int i = 0;
225
226     while ( ( ss = hb_list_item( stream_state_list, i++ ) ) != NULL )
227     {
228         if ( strcmp( path, ss->path ) == 0 )
229         {
230             break;
231         }
232     }
233     return ss;
234 }
235
236 static void hb_stream_state_delete( hb_stream_t *ss )
237 {
238     hb_list_rem( stream_state_list, ss );
239     free( ss->path );
240     free( ss );
241 }
242
243 /*
244  * logging routines.
245  * these frontend hb_log because transport streams can have a lot of errors
246  * so we want to rate limit messages. this routine limits the number of
247  * messages to at most one per minute of video. other errors that occur
248  * during the minute are counted & the count is output with the next
249  * error msg we print.
250  */
251 static void ts_warn_helper( hb_stream_t *stream, char *log, va_list args )
252 {
253     // limit error printing to at most one per minute of video (at 30fps)
254     ++stream->errors;
255     if ( stream->frames - stream->last_error_frame >= 30*60 )
256     {
257         char msg[256];
258
259         vsnprintf( msg, sizeof(msg), log, args );
260
261         if ( stream->errors - stream->last_error_count < 10 )
262         {
263             hb_log( "stream: error near frame %d: %s", stream->frames, msg );
264         }
265         else
266         {
267             int Edelta = stream->errors - stream->last_error_count;
268             double Epcnt = (double)Edelta * 100. /
269                             (stream->frames - stream->last_error_frame);
270             hb_log( "stream: %d new errors (%.0f%%) up to frame %d: %s",
271                     Edelta, Epcnt, stream->frames, msg );
272         }
273         stream->last_error_frame = stream->frames;
274         stream->last_error_count = stream->errors;
275     }
276 }
277
278 static void ts_warn( hb_stream_t *stream, char *log, ... )
279 {
280     va_list     args;
281     va_start( args, log );
282     ts_warn_helper( stream, log, args );
283     va_end( args );
284 }
285
286 static void ts_err( hb_stream_t *stream, int curstream, char *log, ... )
287 {
288     va_list     args;
289     va_start( args, log );
290     ts_warn_helper( stream, log, args );
291     va_end( args );
292
293     stream->ts_skipbad[curstream] = 1;
294     stream->ts_pos[curstream] = 0;
295     stream->ts_streamcont[curstream] = -1;
296 }
297
298 static int check_ps_sync(const uint8_t *buf)
299 {
300     // a legal MPEG program stream must start with a Pack header in the
301     // first four bytes.
302     return (buf[0] == 0x00) && (buf[1] == 0x00) &&
303            (buf[2] == 0x01) && (buf[3] == 0xba);
304 }
305
306 static int check_ps_sc(const uint8_t *buf)
307 {
308     // a legal MPEG program stream must start with a Pack followed by a
309     // some other start code. If we've already verified the pack, this skip
310     // it and checks for a start code prefix.
311     int pos = 14 + ( buf[13] & 0x7 );   // skip over the PACK
312     return (buf[pos+0] == 0x00) && (buf[pos+1] == 0x00) && (buf[pos+2] == 0x01);
313 }
314
315 static int check_ts_sync(const uint8_t *buf)
316 {
317     // must have initial sync byte, no scrambling & a legal adaptation ctrl
318     return (buf[0] == 0x47) && ((buf[3] >> 6) == 0) && ((buf[3] >> 4) > 0);
319 }
320
321 static int have_ts_sync(const uint8_t *buf, int psize)
322 {
323     return check_ts_sync(&buf[0*psize]) && check_ts_sync(&buf[1*psize]) &&
324            check_ts_sync(&buf[2*psize]) && check_ts_sync(&buf[3*psize]) &&
325            check_ts_sync(&buf[4*psize]) && check_ts_sync(&buf[5*psize]) &&
326            check_ts_sync(&buf[6*psize]) && check_ts_sync(&buf[7*psize]);
327 }
328
329 static int hb_stream_check_for_ts(const uint8_t *buf)
330 {
331     // transport streams should have a sync byte every 188 bytes.
332     // search the first 8KB of buf looking for at least 8 consecutive
333     // correctly located sync patterns.
334     int offset = 0;
335
336     for ( offset = 0; offset < 8*1024-8*188; ++offset )
337     {
338         if ( have_ts_sync( &buf[offset], 188) )
339             return 188 | (offset << 8);
340         if ( have_ts_sync( &buf[offset], 192) )
341             return 192 | (offset << 8);
342         if ( have_ts_sync( &buf[offset], 204) )
343             return 204 | (offset << 8);
344         if ( have_ts_sync( &buf[offset], 208) )
345             return 208 | (offset << 8);
346     }
347     return 0;
348 }
349
350 static int hb_stream_check_for_ps(const uint8_t *buf)
351 {
352     // program streams should start with a PACK then some other mpeg start
353     // code (usually a SYS but that might be missing if we only have a clip).
354     return check_ps_sync(buf) && check_ps_sc(buf);
355 }
356
357 static int hb_stream_check_for_dvd_ps(const uint8_t *buf)
358 {
359     // DVD program streams should have a Pack header every 2048 bytes.
360     // check that we have 4 of these in a row.
361     return check_ps_sync(&buf[0*2048]) && check_ps_sync(&buf[1*2048]) &&
362            check_ps_sync(&buf[2*2048]) && check_ps_sync(&buf[3*2048]);
363 }
364
365 static int hb_stream_get_type(hb_stream_t *stream)
366 {
367     uint8_t buf[2048*4];
368
369     if ( fread(buf, 1, sizeof(buf), stream->file_handle) == sizeof(buf) )
370     {
371         int psize;
372         if ( ( psize = hb_stream_check_for_ts(buf) ) != 0 )
373         {
374             int offset = psize >> 8;
375             psize &= 0xff;
376             hb_log("file is MPEG Transport Stream with %d byte packets"
377                    " offset %d bytes", psize, offset);
378             stream->packetsize = psize;
379             stream->hb_stream_type = transport;
380             hb_ts_stream_init(stream);
381             if ( !stream->ts_number_video_pids || !stream->ts_number_audio_pids )
382             {
383                 return 0;
384             }
385             return 1;
386         }
387         if ( hb_stream_check_for_dvd_ps(buf) != 0 )
388         {
389             hb_log("file is MPEG DVD Program Stream");
390             stream->hb_stream_type = dvd_program;
391             return 1;
392         }
393         if ( hb_stream_check_for_ps(buf) != 0 )
394         {
395             hb_log("file is MPEG Program Stream");
396             stream->hb_stream_type = program;
397             return 1;
398         }
399     }
400     return 0;
401 }
402
403 static void hb_stream_delete_dynamic( hb_stream_t *d )
404 {
405     if( d->file_handle )
406     {
407         fclose( d->file_handle );
408                 d->file_handle = NULL;
409     }
410
411         int i=0;
412
413     if ( d->ts_packet )
414     {
415         free( d->ts_packet );
416         d->ts_packet = NULL;
417     }
418         for (i = 0; i < kMaxNumberDecodeStreams; i++)
419         {
420                 if (d->ts_buf[i])
421                 {
422                         hb_buffer_close(&(d->ts_buf[i]));
423                         d->ts_buf[i] = NULL;
424                 }
425         }
426 }
427
428 static void hb_stream_delete( hb_stream_t *d )
429 {
430     hb_stream_delete_dynamic( d );
431     free( d->path );
432     free( d );
433 }
434
435 static int audio_inactive( hb_stream_t *stream, int indx )
436 {
437     int aud_indx = indx - 1;
438
439     if ( stream->ts_audio_pids[aud_indx] < 0 )
440     {
441         // PID declared inactive by hb_stream_title_scan
442         return 1;
443     }
444     if ( stream->ts_audio_pids[aud_indx] == stream->pmt_info.PCR_PID )
445     {
446         // PCR PID is always active
447         return 0;
448     }
449
450     // see if we should make the stream inactive because scan.c didn't
451     // find a valid audio bitstream.
452     int i;
453     for ( i = 0; i < hb_list_count( stream->title->list_audio ); ++i )
454     {
455         hb_audio_t *audio = hb_list_item( stream->title->list_audio, i );
456         if ( audio->id == indx )
457         {
458             return 0;
459         }
460     }
461     // not in the title's audio list - declare the PID inactive
462     stream->ts_audio_pids[aud_indx] = -stream->ts_audio_pids[aud_indx];
463     return 1;
464 }
465
466 /***********************************************************************
467  * hb_stream_open
468  ***********************************************************************
469  *
470  **********************************************************************/
471 hb_stream_t * hb_stream_open( char *path, hb_title_t *title )
472 {
473     FILE *f = fopen( path, "r" );
474     if ( f == NULL )
475     {
476         hb_log( "hb_stream_open: open %s failed", path );
477         return NULL;
478     }
479
480     hb_stream_t *d = calloc( sizeof( hb_stream_t ), 1 );
481     if ( d == NULL )
482     {
483         fclose( f );
484         hb_log( "hb_stream_open: can't allocate space for %s stream state", path );
485         return NULL;
486     }
487
488     /*
489      * if we're opening the stream to read & convert, we need
490      * the state we saved when we scanned the stream. if we're
491      * opening the stream to scan it we want to rebuild the state
492      * (even if we have saved state, the stream may have changed).
493      */
494     hb_stream_t *ss = hb_stream_lookup( path );
495     if ( title && ss && ss->hb_stream_type != ffmpeg )
496     {
497         /*
498          * copy the saved state since we might be encoding the same stream
499          * multiple times.
500          */
501         memcpy( d, ss, sizeof(*d) );
502         d->file_handle = f;
503         d->title = title;
504         d->path = strdup( path );
505
506         if ( d->hb_stream_type == transport )
507         {
508             d->ts_packet = malloc( d->packetsize );
509
510             int i = 0;
511             for ( ; i < d->ts_number_video_pids + d->ts_number_audio_pids; i++)
512             {
513                 if ( i && audio_inactive( d, i ) )
514                 {
515                     // this PID isn't wanted (we don't have a codec for it
516                     // or scan didn't find audio parameters)
517                     continue;
518                 }
519                 d->ts_buf[i] = hb_buffer_init(d->packetsize);
520                                 d->ts_buf[i]->size = 0;
521             }
522             hb_stream_seek( d, 0. );
523         }
524         return d;
525     }
526
527     /*
528      * opening for scan - delete any saved state then (re)scan the stream.
529      * If it's something we can deal with (MPEG2 PS or TS) return a stream
530      * reference structure & null otherwise.
531      */
532     if ( ss != NULL )
533     {
534         hb_stream_state_delete( ss );
535     }
536     d->file_handle = f;
537     d->title = title;
538     d->path = strdup( path );
539     if (d->path != NULL )
540     {
541         if ( hb_stream_get_type( d ) != 0 )
542         {
543             return d;
544         }
545         fclose( d->file_handle );
546                 d->file_handle = NULL;
547         if ( ffmpeg_open( d, title ) )
548         {
549             return d;
550         }
551     }
552     if ( d->file_handle )
553     {
554         fclose( d->file_handle );
555     }
556     if (d->path)
557     {
558         free( d->path );
559     }
560     hb_log( "hb_stream_open: open %s failed", path );
561     free( d );
562     return NULL;
563 }
564
565 /***********************************************************************
566  * hb_stream_close
567  ***********************************************************************
568  * Closes and frees everything
569  **********************************************************************/
570 void hb_stream_close( hb_stream_t ** _d )
571 {
572     hb_stream_t *stream = * _d;
573
574     if ( stream->hb_stream_type == ffmpeg )
575     {
576         ffmpeg_close( stream );
577         hb_stream_delete( stream );
578         *_d = NULL;
579         return;
580     }
581
582     if ( stream->frames )
583     {
584         hb_log( "stream: %d good frames, %d errors (%.0f%%)", stream->frames,
585                 stream->errors, (double)stream->errors * 100. /
586                 (double)stream->frames );
587     }
588
589     /*
590      * if the stream was opened for a scan, cache the result, otherwise delete
591      * the state.
592      */
593     if ( stream->title == NULL )
594     {
595         hb_stream_delete_dynamic( stream );
596         if ( stream_state_list == NULL )
597         {
598             stream_state_list = hb_list_init();
599         }
600         hb_list_add( stream_state_list, stream );
601     }
602     else
603     {
604         hb_stream_delete( stream );
605     }
606     *_d = NULL;
607 }
608
609 /* when the file was first opened we made entries for all the audio elementary
610  * streams we found in it. Streams that were later found during the preview scan
611  * now have an audio codec, type, rate, etc., associated with them. At the end
612  * of the scan we delete all the audio entries that weren't found by the scan
613  * or don't have a format we support. This routine deletes audio entry 'indx'
614  * by setting its PID to an invalid value so no packet will match it. (We can't
615  * move any of the entries since the index of the entry is used as the id
616  * of the media stream for HB. */
617 static void hb_stream_delete_audio_entry(hb_stream_t *stream, int indx)
618 {
619     if ( stream->ts_audio_pids[indx] > 0 )
620     {
621         stream->ts_audio_pids[indx] = -stream->ts_audio_pids[indx];
622     }
623 }
624
625 static int index_of_pid(int pid, hb_stream_t *stream)
626 {
627     int i;
628
629     if ( pid == stream->ts_video_pids[0] )
630         return 0;
631
632     for ( i = 0; i < stream->ts_number_audio_pids; ++i )
633         if ( pid == stream->ts_audio_pids[i] )
634             return i + 1;
635
636     return -1;
637 }
638
639 /***********************************************************************
640  * hb_ps_stream_title_scan
641  ***********************************************************************
642  *
643  **********************************************************************/
644 hb_title_t * hb_stream_title_scan(hb_stream_t *stream)
645 {
646         if ( stream->hb_stream_type == ffmpeg )
647         return ffmpeg_title_scan( stream );
648
649     // 'Barebones Title'
650     hb_title_t *aTitle = hb_title_init( stream->path, 0 );
651     aTitle->index = 1;
652
653         // Copy part of the stream path to the title name
654         char *sep = strrchr(stream->path, '/');
655         if (sep)
656                 strcpy(aTitle->name, sep+1);
657         char *dot_term = strrchr(aTitle->name, '.');
658         if (dot_term)
659                 *dot_term = '\0';
660
661     // Height, width,  rate and aspect ratio information is filled in when the previews are built
662
663     hb_stream_duration(stream, aTitle);
664
665     // One Chapter
666     hb_chapter_t * chapter;
667     chapter = calloc( sizeof( hb_chapter_t ), 1 );
668     chapter->index = 1;
669     chapter->duration = aTitle->duration;
670     chapter->hours = aTitle->hours;
671     chapter->minutes = aTitle->minutes;
672     chapter->seconds = aTitle->seconds;
673     hb_list_add( aTitle->list_chapter, chapter );
674
675     // Figure out how many audio streams we really have:
676     // - For transport streams, for each PID listed in the PMT (whether
677     //   or not it was an audio stream type) read the bitstream until we
678     //   find an packet from that PID containing a PES header and see if
679     //   the elementary stream is an audio type.
680     // - For program streams read the first 4MB and take every unique
681     //   audio stream we find.
682         if (stream->hb_stream_type == transport)
683         {
684         int i;
685
686         for (i=0; i < stream->ts_number_audio_pids; i++)
687         {
688             hb_audio_t *audio = hb_ts_stream_set_audio_id_and_codec(stream, i);
689             if (audio->config.in.codec)
690                 hb_list_add( aTitle->list_audio, audio );
691             else
692             {
693                 free(audio);
694                 hb_stream_delete_audio_entry(stream, i);
695             }
696         }
697
698         // make sure we're grabbing the PCR PID
699         if ( index_of_pid( stream->pmt_info.PCR_PID, stream ) < 0 )
700         {
701             stream->ts_audio_pids[stream->ts_number_audio_pids++] =
702                 stream->pmt_info.PCR_PID;
703         }
704
705         // set the video id, codec & muxer
706         aTitle->video_id = 0;
707         aTitle->video_codec = st2codec[stream->ts_stream_type[0]].codec;
708         aTitle->video_codec_param = st2codec[stream->ts_stream_type[0]].codec_param;
709         aTitle->demuxer = HB_MPEG2_TS_DEMUXER;
710
711         if ( ( stream->ts_flags & TS_HAS_PCR ) == 0 )
712         {
713             hb_log( "transport stream missing PCRs - using video DTS instead" );
714         }
715
716         if ( stream->ts_IDRs < 1 )
717         {
718             hb_log( "transport stream doesn't seem to have video IDR frames" );
719             aTitle->flags |= HBTF_NO_IDR;
720         }
721         }
722     else
723     {
724         hb_ps_stream_find_audio_ids(stream, aTitle);
725     }
726
727   return aTitle;
728 }
729
730 /*
731  * read the next transport stream packet from 'stream'. Return NULL if
732  * we hit eof & a pointer to the sync byte otherwise.
733  */
734 static const uint8_t *next_packet( hb_stream_t *stream )
735 {
736     uint8_t *buf = stream->ts_packet + stream->packetsize - 188;
737
738     while ( 1 )
739     {
740         if ( fread(stream->ts_packet, 1, stream->packetsize, stream->file_handle) !=
741              stream->packetsize )
742         {
743             return NULL;
744         }
745         if (buf[0] == 0x47)
746         {
747             return buf;
748         }
749         // lost sync - back up to where we started then try to re-establish.
750         off_t pos = ftello(stream->file_handle) - stream->packetsize;
751         off_t pos2 = align_to_next_packet(stream);
752         if ( pos2 == 0 )
753         {
754             hb_log( "next_packet: eof while re-establishing sync @ %lld", pos );
755             return NULL;
756         }
757         ts_warn( stream, "next_packet: sync lost @ %lld, regained after %lld bytes",
758                  pos, pos2 );
759     }
760 }
761
762 /*
763  * skip to the start of the next PACK header in program stream src_stream.
764  */
765 static void skip_to_next_pack( hb_stream_t *src_stream )
766 {
767     // scan forward until we find the start of the next pack
768     uint32_t strt_code = -1;
769     int c;
770
771     flockfile( src_stream->file_handle );
772     while ( ( c = getc_unlocked( src_stream->file_handle ) ) != EOF )
773     {
774         strt_code = ( strt_code << 8 ) | c;
775         if ( strt_code == 0x000001ba )
776             // we found the start of the next pack
777             break;
778     }
779     funlockfile( src_stream->file_handle );
780
781     // if we didn't terminate on an eof back up so the next read
782     // starts on the pack boundary.
783     if ( c != EOF )
784     {
785         fseeko( src_stream->file_handle, -4, SEEK_CUR );
786     }
787 }
788
789 static int isIframe( hb_stream_t *stream, const uint8_t *buf, int adapt_len )
790 {
791     // For mpeg2: look for a gop start or i-frame picture start
792     // for h.264: look for idr nal type or a slice header for an i-frame
793     // for vc1:   look for a Sequence header
794     int i;
795     uint32_t strid = 0;
796
797
798     if ( stream->ts_stream_type[0] <= 2 )
799     {
800         // This section of the code handles MPEG-1 and MPEG-2 video streams
801         for (i = 13 + adapt_len; i < 188; i++)
802         {
803             strid = (strid << 8) | buf[i];
804             if ( ( strid >> 8 ) == 1 )
805             {
806                 // we found a start code
807                 uint8_t id = strid;
808                 switch ( id )
809                 {
810                     case 0xB8: // group_start_code (GOP header)
811                     case 0xB3: // sequence_header code
812                         return 1;
813
814                     case 0x00: // picture_start_code
815                         // picture_header, let's see if it's an I-frame
816                         if (i<185)
817                         {
818                             // check if picture_coding_type == 1
819                             if ((buf[i+2] & (0x7 << 3)) == (1 << 3))
820                             {
821                                 // found an I-frame picture
822                                 return 1;
823                             }
824                         }
825                         break;
826                 }
827             }
828         }
829         // didn't find an I-frame
830         return 0;
831     }
832     if ( stream->ts_stream_type[0] == 0x1b )
833     {
834         // we have an h.264 stream 
835         for (i = 13 + adapt_len; i < 188; i++)
836         {
837             strid = (strid << 8) | buf[i];
838             if ( ( strid >> 8 ) == 1 )
839             {
840                 // we found a start code - remove the ref_idc from the nal type
841                 uint8_t nal_type = strid & 0x1f;
842                 if ( nal_type == 0x05 )
843                     // h.264 IDR picture start
844                     return 1;
845             }
846         }
847         // didn't find an I-frame
848         return 0;
849     }
850     if ( stream->ts_stream_type[0] == 0xea )
851     {
852         // we have an vc1 stream 
853         for (i = 13 + adapt_len; i < 188; i++)
854         {
855             strid = (strid << 8) | buf[i];
856             if ( strid == 0x10f )
857             {
858                 // the ffmpeg vc1 decoder requires a seq hdr code in the first
859                 // frame.
860                 return 1;
861             }
862         }
863         // didn't find an I-frame
864         return 0;
865     }
866
867     // we don't understand the stream type so just say "yes" otherwise
868     // we'll discard all the video.
869     return 1;
870 }
871
872 /*
873  * scan the next MB of 'stream' to find the next start packet for
874  * the Packetized Elementary Stream associated with TS PID 'pid'.
875  */
876 static const uint8_t *hb_ts_stream_getPEStype(hb_stream_t *stream, uint32_t pid)
877 {
878     int npack = 300000; // max packets to read
879
880     while (--npack >= 0)
881     {
882         const uint8_t *buf = next_packet( stream );
883         if ( buf == NULL )
884         {
885             hb_log("hb_ts_stream_getPEStype: EOF while searching for PID 0x%x", pid);
886             return 0;
887         }
888
889         // while we're reading the stream, check if it has valid PCRs
890         // and/or random access points.
891         uint32_t pack_pid = ( (buf[1] & 0x1f) << 8 ) | buf[2];
892         if ( pack_pid == stream->pmt_info.PCR_PID )
893         {
894             if ( ( buf[5] & 0x10 ) &&
895                  ( ( ( buf[3] & 0x30 ) == 0x20 ) ||
896                    ( ( buf[3] & 0x30 ) == 0x30 && buf[4] > 6 ) ) )
897             {
898                 stream->ts_flags |= TS_HAS_PCR;
899             }
900         }
901         if ( buf[5] & 0x40 )
902         {
903             stream->ts_flags |= TS_HAS_RAP;
904         }
905
906         /*
907          * The PES header is only in TS packets with 'start' set so we check
908          * that first then check for the right PID.
909          */
910         if ((buf[1] & 0x40) == 0 || pack_pid != pid )
911         {
912             // not a start packet or not the pid we want
913             continue;
914         }
915
916         /* skip over the TS hdr to return a pointer to the PES hdr */
917         int udata = 4;
918         switch (buf[3] & 0x30)
919         {
920             case 0x00: // illegal
921             case 0x20: // fill packet
922                 continue;
923
924             case 0x30: // adaptation
925                 if (buf[4] > 182)
926                 {
927                     hb_log("hb_ts_stream_getPEStype: invalid adaptation field length %d for PID 0x%x", buf[4], pid);
928                     continue;
929                 }
930                 udata += buf[4] + 1;
931                 break;
932         }
933         /* PES hdr has to begin with an mpeg start code */
934         if (buf[udata+0] == 0x00 && buf[udata+1] == 0x00 && buf[udata+2] == 0x01)
935         {
936             return &buf[udata];
937         }
938     }
939
940     /* didn't find it */
941     return 0;
942 }
943
944 static uint64_t hb_ps_stream_getVideoPTS(hb_stream_t *stream)
945 {
946     hb_buffer_t *buf  = hb_buffer_init(HB_DVD_READ_BUFFER_SIZE);
947     hb_list_t *list = hb_list_init();
948     // how many blocks we read while searching for a video PES header
949     int blksleft = 1024;
950     uint64_t pts = 0;
951
952     while (--blksleft >= 0 && hb_stream_read(stream, buf) == 1)
953     {
954         hb_buffer_t *es;
955
956         // 'buf' contains an MPEG2 PACK - get a list of all it's elementary streams
957         hb_demux_ps( buf, list, 0 );
958
959         while ( ( es = hb_list_item( list, 0 ) ) )
960         {
961             hb_list_rem( list, es );
962             if ( es->id == 0xe0 )
963             {
964                 // this PES contains video - if there's a PTS we're done
965                 // hb_demux_ps left the PTS in buf_es->start.
966                 if ( es->start != ~0 )
967                 {
968                     pts = es->start;
969                     blksleft = 0;
970                     break;
971                 }
972             }
973             hb_buffer_close( &es );
974         }
975     }
976     hb_list_empty( &list );
977     hb_buffer_close(&buf);
978     return pts;
979 }
980
981 /***********************************************************************
982  * hb_stream_duration
983  ***********************************************************************
984  *
985  * Finding stream duration is difficult.  One issue is that the video file
986  * may have chunks from several different program fragments (main feature,
987  * commercials, station id, trailers, etc.) all with their own base pts
988  * value.  We can't find the piece boundaries without reading the entire
989  * file but if we compute a rate based on time stamps from two different
990  * pieces the result will be meaningless.  The second issue is that the
991  * data rate of compressed video normally varies by 5-10x over the length
992  * of the video. This says that we want to compute the rate over relatively
993  * long segments to get a representative average but long segments increase
994  * the likelihood that we'll cross a piece boundary.
995  *
996  * What we do is take time stamp samples at several places in the file
997  * (currently 16) then compute the average rate (i.e., ticks of video per
998  * byte of the file) for all pairs of samples (N^2 rates computed for N
999  * samples). Some of those rates will be absurd because the samples came
1000  * from different segments. Some will be way low or high because the
1001  * samples came from a low or high motion part of the segment. But given
1002  * that we're comparing *all* pairs the majority of the computed rates
1003  * should be near the overall average.  So we median filter the computed
1004  * rates to pick the most representative value.
1005  *
1006  **********************************************************************/
1007 struct pts_pos {
1008     uint64_t pos;   /* file position of this PTS sample */
1009     uint64_t pts;   /* PTS from video stream */
1010 };
1011
1012 #define NDURSAMPLES 128
1013
1014 // get one (position, timestamp) sampple from a transport or program
1015 // stream.
1016 static struct pts_pos hb_sample_pts(hb_stream_t *stream, uint64_t fpos)
1017 {
1018     struct pts_pos pp = { 0, 0 };
1019
1020     if ( stream->hb_stream_type == transport )
1021     {
1022         const uint8_t *buf;
1023         fseeko( stream->file_handle, fpos, SEEK_SET );
1024         align_to_next_packet( stream );
1025         buf = hb_ts_stream_getPEStype( stream, stream->ts_video_pids[0] );
1026         if ( buf == NULL )
1027         {
1028             hb_log("hb_sample_pts: couldn't find video packet near %llu", fpos);
1029             return pp;
1030         }
1031         if ( ( buf[7] >> 7 ) != 1 )
1032         {
1033             hb_log("hb_sample_pts: no PTS in video packet near %llu", fpos);
1034             return pp;
1035         }
1036         pp.pts = ( ( (uint64_t)buf[9] >> 1 ) & 7 << 30 ) |
1037                  ( (uint64_t)buf[10] << 22 ) |
1038                  ( ( (uint64_t)buf[11] >> 1 ) << 15 ) |
1039                  ( (uint64_t)buf[12] << 7 ) |
1040                  ( (uint64_t)buf[13] >> 1 );
1041
1042         if ( isIframe( stream, buf, -4 ) )
1043         {
1044             if (  stream->ts_IDRs < 255 )
1045             {
1046                 ++stream->ts_IDRs;
1047             }
1048         }
1049     }
1050     else
1051     {
1052         // round address down to nearest dvd sector start
1053         fpos &=~ ( HB_DVD_READ_BUFFER_SIZE - 1 );
1054         fseeko( stream->file_handle, fpos, SEEK_SET );
1055         if ( stream->hb_stream_type == program )
1056         {
1057             skip_to_next_pack( stream );
1058         }
1059         pp.pts = hb_ps_stream_getVideoPTS( stream );
1060     }
1061     pp.pos = ftello(stream->file_handle);
1062     return pp;
1063 }
1064
1065 static int dur_compare( const void *a, const void *b )
1066 {
1067     const double *aval = a, *bval = b;
1068     return ( *aval < *bval ? -1 : ( *aval == *bval ? 0 : 1 ) );
1069 }
1070
1071 // given an array of (position, time) samples, compute a max-likelihood
1072 // estimate of the average rate by computing the rate between all pairs
1073 // of samples then taking the median of those rates.
1074 static double compute_stream_rate( struct pts_pos *pp, int n )
1075 {
1076     int i, j;
1077     double rates[NDURSAMPLES * NDURSAMPLES / 8];
1078     double *rp = rates;
1079
1080     // the following nested loops compute the rates between all pairs.
1081     *rp = 0;
1082     for ( i = 0; i < n-1; ++i )
1083     {
1084         // Bias the median filter by not including pairs that are "far"
1085         // from one another. This is to handle cases where the file is
1086         // made of roughly equal size pieces where a symmetric choice of
1087         // pairs results in having the same number of intra-piece &
1088         // inter-piece rate estimates. This would mean that the median
1089         // could easily fall in the inter-piece part of the data which
1090         // would give a bogus estimate. The 'ns' index creates an
1091         // asymmetry that favors locality.
1092         int ns = i + ( n >> 3 );
1093         if ( ns > n )
1094             ns = n;
1095         for ( j = i+1; j < ns; ++j )
1096         {
1097             if ( (uint64_t)(pp[j].pts - pp[i].pts) > 90000LL*3600*6 )
1098                 break;
1099             if ( pp[j].pts != pp[i].pts && pp[j].pos > pp[i].pos )
1100             {
1101                 *rp = ((double)( pp[j].pts - pp[i].pts )) /
1102                       ((double)( pp[j].pos - pp[i].pos ));
1103                                 ++rp;
1104             }
1105         }
1106     }
1107     // now compute and return the median of all the (n*n/2) rates we computed
1108     // above.
1109     int nrates = rp - rates;
1110     qsort( rates, nrates, sizeof (rates[0] ), dur_compare );
1111     return rates[nrates >> 1];
1112 }
1113
1114 static void hb_stream_duration(hb_stream_t *stream, hb_title_t *inTitle)
1115 {
1116     struct pts_pos ptspos[NDURSAMPLES];
1117     struct pts_pos *pp = ptspos;
1118     int i;
1119
1120     fseeko(stream->file_handle, 0, SEEK_END);
1121     uint64_t fsize = ftello(stream->file_handle);
1122     uint64_t fincr = fsize / NDURSAMPLES;
1123     uint64_t fpos = fincr / 2;
1124     for ( i = NDURSAMPLES; --i >= 0; fpos += fincr )
1125     {
1126         *pp++ = hb_sample_pts(stream, fpos);
1127     }
1128     uint64_t dur = compute_stream_rate( ptspos, pp - ptspos ) * (double)fsize;
1129     inTitle->duration = dur;
1130     dur /= 90000;
1131     inTitle->hours    = dur / 3600;
1132     inTitle->minutes  = ( dur % 3600 ) / 60;
1133     inTitle->seconds  = dur % 60;
1134
1135     rewind(stream->file_handle);
1136 }
1137
1138 /***********************************************************************
1139  * hb_stream_read
1140  ***********************************************************************
1141  *
1142  **********************************************************************/
1143 int hb_stream_read( hb_stream_t * src_stream, hb_buffer_t * b )
1144 {
1145         if ( src_stream->hb_stream_type == ffmpeg )
1146     {
1147         return ffmpeg_read( src_stream, b );
1148     }
1149     if ( src_stream->hb_stream_type == dvd_program )
1150     {
1151         size_t amt_read = fread(b->data, HB_DVD_READ_BUFFER_SIZE, 1,
1152                                 src_stream->file_handle);
1153         return (amt_read > 0);
1154     }
1155     if ( src_stream->hb_stream_type == program )
1156     {
1157         // a general program stream has arbitrary sized pack's. we're
1158         // currently positioned at the start of a pack so read up to but
1159         // not including the start of the next, expanding the buffer
1160         // as necessary.
1161         uint8_t *cp = b->data;
1162         uint8_t *ep = cp + b->alloc;
1163         uint32_t strt_code = -1;
1164         int c;
1165
1166         // consume the first byte of the initial pack so we don't match on
1167         // it in the loop below.
1168         if ( ( c = getc( src_stream->file_handle ) ) == EOF )
1169             return 0;
1170
1171         *cp++ = c;
1172
1173         flockfile( src_stream->file_handle );
1174         while ( ( c = getc_unlocked( src_stream->file_handle ) ) != EOF )
1175         {
1176             strt_code = ( strt_code << 8 ) | c;
1177             if ( strt_code == 0x000001ba )
1178                 // we found the start of the next pack
1179                 break;
1180             if ( cp >= ep )
1181             {
1182                 // need to expand the buffer
1183                 int curSize = cp - b->data;
1184                 hb_buffer_realloc( b, curSize * 2 );
1185                 cp = b->data + curSize;
1186                 ep = b->data + b->alloc;
1187             }
1188             *cp++ = c;
1189         }
1190         funlockfile( src_stream->file_handle );
1191
1192         // if we didn't terminate on an eof back up so the next read
1193         // starts on the pack boundary.
1194         b->size = cp - b->data;
1195         if ( c != EOF )
1196         {
1197             fseeko( src_stream->file_handle, -4, SEEK_CUR );
1198             b->size -= 4;
1199         }
1200         return 1;
1201     }
1202     return hb_ts_stream_decode( src_stream, b );
1203 }
1204
1205 /***********************************************************************
1206  * hb_stream_seek_chapter
1207  ***********************************************************************
1208  *
1209  **********************************************************************/
1210 int hb_stream_seek_chapter( hb_stream_t * stream, int chapter_num )
1211 {
1212     AVFormatContext *ic = stream->ffmpeg_ic;
1213     uint64_t end_offset = 0;
1214     uint64_t start_offset = 0;
1215     uint64_t pos = 0;
1216     hb_chapter_t *chapter = NULL;
1217     int i;
1218
1219     if( !stream || !stream->title )
1220     {
1221         return 0;
1222     }
1223     if ( stream->hb_stream_type != ffmpeg )
1224     {
1225         // currently meaningliess for transport and program streams
1226         return 1;
1227     }
1228
1229     for( i = 0; i < chapter_num; i++)
1230     {
1231         chapter = hb_list_item( stream->title->list_chapter,
1232                                 i );
1233         
1234         if( chapter )
1235         {
1236             /*
1237              * Seeking to a chapter means that we are in that chapter,
1238              * so track which chapter we are in so that we can output
1239              * the correct chapter numbers in buf->new_chap
1240              */
1241             start_offset = end_offset;
1242             end_offset += chapter->duration;
1243             stream->chapter = i;
1244             stream->chapter_end = end_offset;
1245         } else {
1246             return 0;
1247         }
1248     }
1249
1250     /*
1251      * Is the the correct way to convert timebases? It seems to get it pretty
1252      * much right - plus a few seconds, which is odd.
1253      */
1254     pos = ((start_offset * AV_TIME_BASE) / 90000);
1255
1256     hb_deep_log( 2, "Seeking to chapter %d time (starts: %lld ends %lld) AV pos %lld", chapter_num-1, start_offset, end_offset, pos);
1257
1258     av_seek_frame( ic, -1, pos, 0);
1259
1260     return 1;
1261 }
1262
1263 /***********************************************************************
1264  * hb_stream_chapter
1265  ***********************************************************************
1266  * Return the number of the chapter that we are currently in. We store
1267  * the chapter number starting from 0, so + 1 for the real chpater num.
1268  **********************************************************************/
1269 int hb_stream_chapter( hb_stream_t * src_stream )
1270 {
1271     return( src_stream->chapter + 1 );
1272 }
1273
1274 /***********************************************************************
1275  * hb_stream_seek
1276  ***********************************************************************
1277  *
1278  **********************************************************************/
1279 int hb_stream_seek( hb_stream_t * stream, float f )
1280 {
1281         if ( stream->hb_stream_type == ffmpeg )
1282     {
1283         return ffmpeg_seek( stream, f );
1284     }
1285     off_t stream_size, cur_pos, new_pos;
1286     double pos_ratio = f;
1287     cur_pos = ftello( stream->file_handle );
1288     fseeko( stream->file_handle, 0, SEEK_END );
1289     stream_size = ftello( stream->file_handle );
1290     new_pos = (off_t) ((double) (stream_size) * pos_ratio);
1291     new_pos &=~ (HB_DVD_READ_BUFFER_SIZE - 1);
1292
1293     int r = fseeko( stream->file_handle, new_pos, SEEK_SET );
1294     if (r == -1)
1295     {
1296         fseeko( stream->file_handle, cur_pos, SEEK_SET );
1297         return 0;
1298     }
1299
1300     if ( stream->hb_stream_type == transport )
1301     {
1302         // We need to drop the current decoder output and move
1303         // forwards to the next transport stream packet.
1304         hb_ts_stream_reset(stream);
1305         if ( f > 0 )
1306         {
1307             if ( stream->ts_IDRs )
1308             {
1309                 // the stream has IDRs so look for one.
1310                 stream->need_keyframe = 1;
1311             }
1312         }
1313         else
1314         {
1315             // we're at the beginning - say we have video sync so that we
1316             // won't drop initial SPS & PPS data on an AVC stream.
1317             stream->need_keyframe = 0;
1318         }
1319     }
1320     else if ( stream->hb_stream_type == program )
1321     {
1322         skip_to_next_pack( stream );
1323     }
1324
1325     return 1;
1326 }
1327
1328 static const char* make_upper( const char* s )
1329 {
1330     static char name[8];
1331     char *cp = name;
1332     char *ep = cp + sizeof(name)-1;
1333
1334     while ( *s && cp < ep )
1335     {
1336         *cp++ = islower(*s)? toupper(*s) : *s;
1337         ++s;
1338     }
1339     *cp = 0;
1340     return name;
1341 }
1342
1343 static void set_audio_description( hb_audio_t *audio, iso639_lang_t *lang )
1344 {
1345     /* XXX
1346      * This is a duplicate of code in dvd.c - it should get factored out
1347      * into a common routine. We probably should only be putting the lang
1348      * code or a lang pointer into the audio config & let the common description
1349      * formatting routine in scan.c do all the stuff below.
1350      */
1351     const char *codec_name;
1352     AVCodecContext *cc;
1353
1354     if ( audio->config.in.codec == HB_ACODEC_FFMPEG &&
1355          ( cc = hb_ffmpeg_context( audio->config.in.codec_param ) ) &&
1356          avcodec_find_decoder( cc->codec_id ) )
1357     {
1358         codec_name = make_upper( avcodec_find_decoder( cc->codec_id )->name );
1359         if ( !strcmp( codec_name, "LIBFAAD" ) )
1360         {
1361             codec_name = "AAC";
1362         }
1363     }
1364     else if ( audio->config.in.codec == HB_ACODEC_MPGA &&
1365               avcodec_find_decoder( audio->config.in.codec_param ) )
1366     {
1367         codec_name = avcodec_find_decoder( audio->config.in.codec_param )->name;
1368     }
1369     else
1370     {
1371         codec_name = audio->config.in.codec == HB_ACODEC_AC3 ? "AC3" :
1372                      audio->config.in.codec == HB_ACODEC_DCA ? "DTS" :
1373                      audio->config.in.codec == HB_ACODEC_MPGA ? "MPEG" : 
1374                      audio->config.in.codec == HB_ACODEC_LPCM ? "LPCM" : 
1375                      audio->config.in.codec == HB_ACODEC_FFMPEG ? "FFMPEG" :
1376                      "Unknown";
1377     }
1378     snprintf( audio->config.lang.description,
1379               sizeof( audio->config.lang.description ), "%s (%s)",
1380               strlen(lang->native_name) ? lang->native_name : lang->eng_name,
1381               codec_name );
1382     snprintf( audio->config.lang.simple, sizeof( audio->config.lang.simple ), "%s",
1383               strlen(lang->native_name) ? lang->native_name : lang->eng_name );
1384     snprintf( audio->config.lang.iso639_2, sizeof( audio->config.lang.iso639_2 ),
1385               "%s", lang->iso639_2);
1386 }
1387
1388 static hb_audio_t *hb_ts_stream_set_audio_id_and_codec(hb_stream_t *stream,
1389                                                        int aud_pid_index)
1390 {
1391     off_t cur_pos = ftello(stream->file_handle);
1392     hb_audio_t *audio = calloc( sizeof( hb_audio_t ), 1 );
1393     const uint8_t *buf;
1394
1395     fseeko(stream->file_handle, 0, SEEK_SET);
1396     align_to_next_packet(stream);
1397     buf = hb_ts_stream_getPEStype(stream, stream->ts_audio_pids[aud_pid_index]);
1398
1399     /* check that we found a PES header */
1400     uint8_t stype = 0;
1401     if (buf && buf[0] == 0x00 && buf[1] == 0x00 && buf[2] == 0x01)
1402     {
1403         stype = stream->ts_stream_type[1 + aud_pid_index];
1404
1405         // 0xbd ("private stream 1") is the normal container for non-ISO
1406         // media - AC3/DCA/PCM/etc.
1407         if ( buf[3] == 0xbd )
1408         {
1409             if ( st2codec[stype].kind == U )
1410             {
1411                 // XXX assume unknown stream types are AC-3 (if they're not
1412                 // audio we'll find that out during the scan but if they're
1413                 // some other type of audio we'll end up ignoring them).
1414                 stype = 0x81;
1415                 stream->ts_stream_type[1 + aud_pid_index] = 0x81;
1416             }
1417         }
1418         else if ( buf[3] == 0xfd )
1419         {
1420             // 0xfd indicates an extended stream id (ISO 13818-1(2007)).
1421             // the blu ray consortium apparently forgot to read the portion
1422             // of the MPEG spec that says one PID should map to one media
1423             // stream and multiplexed multiple types of audio into one PID
1424             // using the extended stream identifier of the PES header to
1425             // distinguish them. So we have to check if that's happening and
1426             // if so tell the runtime what esid we want.
1427             if ( st2codec[stype].kind == A && stype == 0x83 &&
1428                  stream->ts_format_id[1 + aud_pid_index] == TS_FORMAT_ID_AC3 )
1429             {
1430                 // This is an interleaved TrueHD/AC-3 stream and the esid of
1431                 // the AC-3 is 0x76
1432                 stream->ts_multiplexed[1 + aud_pid_index] = 0x76;
1433                 stype = 0x81;
1434                 stream->ts_stream_type[1 + aud_pid_index] = 0x81;
1435             }
1436             if ( st2codec[stype].kind == A && stype == 0x86 )
1437             {
1438                 // This is an interleaved DTS-HD/DTS stream and the esid of
1439                 // the DTS is 0x71
1440                 stream->ts_multiplexed[1 + aud_pid_index] = 0x71;
1441                 stype = 0x82;
1442                 stream->ts_stream_type[1 + aud_pid_index] = 0x82;
1443             }
1444         }
1445         else if ((buf[3] & 0xe0) == 0xc0)
1446         {
1447             // 0xC0 - 0xCF are the normal containers for ISO-standard
1448             // media (mpeg2 audio and mpeg4 AAC).
1449             if ( st2codec[stype].kind == U )
1450             {
1451                 // XXX assume unknown stream types are MPEG audio
1452                 stype = 0x03;
1453                 stream->ts_stream_type[1 + aud_pid_index] = 0x03;
1454             }
1455         }
1456         else
1457         {
1458             stype = 0;
1459         }
1460     }
1461     // if we found an audio stream type & HB has a codec that can decode it
1462     // finish configuring the audio so we'll add it to the title's list.
1463     if ( st2codec[stype].kind == A && st2codec[stype].codec )
1464     {
1465         audio->id = 1 + aud_pid_index;
1466         audio->config.in.codec = st2codec[stype].codec;
1467         audio->config.in.codec_param = st2codec[stype].codec_param;
1468                 set_audio_description( audio,
1469                   lang_for_code( stream->a52_info[aud_pid_index].lang_code ) );
1470         hb_log("transport stream pid 0x%x (type 0x%x) may be %s audio (id 0x%x)",
1471                stream->ts_audio_pids[aud_pid_index],
1472                stype, st2codec[stype].name, audio->id);
1473     }
1474     else
1475     {
1476         if ( buf )
1477         {
1478             hb_log("transport stream pid 0x%x (type 0x%x, substream 0x%x) "
1479                     "isn't audio", stream->ts_audio_pids[aud_pid_index],
1480                     stream->ts_stream_type[1 + aud_pid_index], buf[3]);
1481         }
1482         else
1483         {
1484             hb_log("transport stream pid 0x%x (type 0x%x) isn't audio",
1485                     stream->ts_audio_pids[aud_pid_index],
1486                     stream->ts_stream_type[1 + aud_pid_index]);
1487         }
1488         }
1489     fseeko(stream->file_handle, cur_pos, SEEK_SET);
1490     return audio;
1491 }
1492
1493 static void add_audio_to_title(hb_title_t *title, int id)
1494 {
1495     hb_audio_t *audio = calloc( sizeof( hb_audio_t ), 1 );
1496
1497     audio->id = id;
1498     switch ( id >> 12 )
1499     {
1500         case 0x0:
1501             audio->config.in.codec = HB_ACODEC_MPGA;
1502             hb_log("add_audio_to_title: added MPEG audio stream 0x%x", id);
1503             break;
1504         case 0x2:
1505             // type 2 is a DVD subtitle stream - just ignore it */
1506             free( audio );
1507             return;
1508         case 0x8:
1509             audio->config.in.codec = HB_ACODEC_AC3;
1510             hb_log("add_audio_to_title: added AC3 audio stream 0x%x", id);
1511             break;
1512         case 0xa:
1513             audio->config.in.codec = HB_ACODEC_LPCM;
1514             hb_log("add_audio_to_title: added LPCM audio stream 0x%x", id);
1515             break;
1516         default:
1517             hb_log("add_audio_to_title: unknown audio stream type 0x%x", id);
1518             free( audio );
1519             return;
1520
1521     }
1522     set_audio_description( audio, lang_for_code( 0 ) );
1523     hb_list_add( title->list_audio, audio );
1524 }
1525
1526 static void hb_ps_stream_find_audio_ids(hb_stream_t *stream, hb_title_t *title)
1527 {
1528     off_t cur_pos = ftello(stream->file_handle);
1529     hb_buffer_t *buf  = hb_buffer_init(HB_DVD_READ_BUFFER_SIZE);
1530     hb_list_t *list = hb_list_init();
1531     // how many blocks we read while searching for audio streams
1532     int blksleft = 4096;
1533     // there can be at most 16 unique streams in an MPEG PS (8 in a DVD)
1534     // so we use a bitmap to keep track of the ones we've already seen.
1535     // Bit 'i' of smap is set if we've already added the audio for
1536     // audio substream id 'i' to the title's audio list.
1537     uint32_t smap = 0;
1538
1539     // start looking 20% into the file since there's occasionally no
1540     // audio at the beginning (particularly for vobs).
1541     hb_stream_seek(stream, 0.2f);
1542
1543     while (--blksleft >= 0 && hb_stream_read(stream, buf) == 1)
1544     {
1545         hb_buffer_t *es;
1546
1547         // 'buf' contains an MPEG2 PACK - get a list of all it's elementary streams
1548         hb_demux_ps( buf, list, 0 );
1549
1550         while ( ( es = hb_list_item( list, 0 ) ) )
1551         {
1552             hb_list_rem( list, es );
1553             if ( (es->id & 0xff) == 0xbd || (es->id & 0xe0) == 0xc0 )
1554             {
1555                 // this PES contains some kind of audio - get the substream id
1556                 // and check if we've seen it already.
1557                 int ssid = (es->id > 0xff ? es->id >> 8 : es->id) & 0xf;
1558                 if ( (smap & (1 << ssid)) == 0 )
1559                 {
1560                     // we haven't seen this stream before - add it to the
1561                     // title's list of audio streams.
1562                     smap |= (1 << ssid);
1563                     add_audio_to_title(title, es->id);
1564                 }
1565             }
1566             hb_buffer_close( &es );
1567         }
1568     }
1569     hb_list_empty( &list );
1570     hb_buffer_close(&buf);
1571     fseeko(stream->file_handle, cur_pos, SEEK_SET);
1572 }
1573
1574 /***********************************************************************
1575  * hb_ts_stream_init
1576  ***********************************************************************
1577  *
1578  **********************************************************************/
1579
1580 static void hb_ts_stream_init(hb_stream_t *stream)
1581 {
1582         int i;
1583
1584         for (i=0; i < kMaxNumberDecodeStreams; i++)
1585         {
1586                 stream->ts_streamcont[i] = -1;
1587         }
1588         stream->ts_video_pids[0] = -1;
1589     for ( i = 0; i < stream->ts_number_audio_pids; i++ )
1590     {
1591         stream-> ts_audio_pids[i] = -1;
1592     }
1593
1594     stream->ts_packet = malloc( stream->packetsize );
1595
1596         // Find the audio and video pids in the stream
1597         hb_ts_stream_find_pids(stream);
1598
1599         for (i = 0; i < stream->ts_number_video_pids + stream->ts_number_audio_pids; i++)
1600         {
1601         // demuxing buffer for TS to PS conversion
1602                 stream->ts_buf[i] = hb_buffer_init(stream->packetsize);
1603                 stream->ts_buf[i]->size = 0;
1604         }
1605 }
1606
1607 #define MAX_HOLE 208*80
1608
1609 static off_t align_to_next_packet(hb_stream_t *stream)
1610 {
1611     uint8_t buf[MAX_HOLE];
1612         off_t pos = 0;
1613     off_t start = ftello(stream->file_handle);
1614
1615     if ( start >= stream->packetsize ) {
1616         start -= stream->packetsize;
1617         fseeko(stream->file_handle, start, SEEK_SET);
1618     }
1619
1620     if (fread(buf, sizeof(buf), 1, stream->file_handle) == 1)
1621         {
1622         const uint8_t *bp = buf;
1623         int i;
1624
1625         for ( i = sizeof(buf); --i >= 0; ++bp )
1626         {
1627             if ( have_ts_sync( bp, stream->packetsize ) )
1628             {
1629                 break;
1630             }
1631         }
1632         if ( i >= 0 )
1633         {
1634             pos = ( bp - buf ) - stream->packetsize + 188;
1635             if ( pos < 0 )
1636                 pos = 0;
1637         }
1638         }
1639     fseeko(stream->file_handle, start+pos, SEEK_SET);
1640         return pos;
1641 }
1642
1643
1644 typedef struct {
1645     uint8_t *buf;
1646     uint32_t val;
1647     int pos;
1648 } bitbuf_t;
1649
1650 static const unsigned int bitmask[] = {
1651         0x0,0x1,0x3,0x7,0xf,0x1f,0x3f,0x7f,0xff,
1652         0x1ff,0x3ff,0x7ff,0xfff,0x1fff,0x3fff,0x7fff,0xffff,
1653         0x1ffff,0x3ffff,0x7ffff,0xfffff,0x1fffff,0x3fffff,0x7fffff,0xffffff,
1654         0x1ffffff,0x3ffffff,0x7ffffff,0xfffffff,0x1fffffff,0x3fffffff,0x7fffffff,0xffffffff};
1655
1656 static inline void set_buf(bitbuf_t *bb, uint8_t* buf, int bufsize, int clear)
1657 {
1658         bb->pos = 0;
1659         bb->buf = buf;
1660         bb->val = (bb->buf[0] << 24) | (bb->buf[1] << 16) |
1661               (bb->buf[2] << 8) | bb->buf[3];
1662         if (clear)
1663                 memset(bb->buf, 0, bufsize);
1664 }
1665
1666 static inline int buf_size(bitbuf_t *bb)
1667 {
1668         return bb->pos >> 3;
1669 }
1670
1671 static inline unsigned int get_bits(bitbuf_t *bb, int bits)
1672 {
1673         unsigned int val;
1674         int left = 32 - (bb->pos & 31);
1675
1676         if (bits < left)
1677         {
1678                 val = (bb->val >> (left - bits)) & bitmask[bits];
1679                 bb->pos += bits;
1680         }
1681         else
1682         {
1683                 val = (bb->val & bitmask[left]) << (bits - left);
1684                 bb->pos += left;
1685                 bits -= left;
1686
1687                 int pos = bb->pos >> 3;
1688                 bb->val = (bb->buf[pos] << 24) | (bb->buf[pos + 1] << 16) | (bb->buf[pos + 2] << 8) | bb->buf[pos + 3];
1689
1690                 if (bits > 0)
1691                 {
1692                         val |= (bb->val >> (32 - bits)) & bitmask[bits];
1693                         bb->pos += bits;
1694                 }
1695         }
1696
1697         return val;
1698 }
1699
1700 // extract what useful information we can from the elementary stream
1701 // descriptor list at 'dp' and add it to the stream at 'esindx'.
1702 // Descriptors with info we don't currently use are ignored.
1703 // The descriptor list & descriptor item formats are defined in
1704 // ISO 13818-1 (2000E) section 2.6 (pg. 62).
1705 static void decode_element_descriptors(hb_stream_t* stream, int esindx,
1706                                        const uint8_t *dp, uint8_t dlen)
1707 {
1708     const uint8_t *ep = dp + dlen;
1709
1710     while (dp < ep)
1711     {
1712         switch (dp[0])
1713         {
1714             case 5:    // Registration descriptor
1715                 stream->ts_format_id[esindx] = (dp[2] << 24) | (dp[3] << 16) |
1716                                                (dp[4] << 8)  | dp[5];
1717                 break;
1718
1719             case 10:    // ISO_639_language descriptor
1720                 stream->a52_info[esindx].lang_code = lang_to_code(lang_for_code2((const char *)&dp[2]));
1721                 break;
1722
1723             default:
1724                 break;
1725         }
1726         dp += dp[1] + 2;
1727     }
1728 }
1729
1730 static const char *stream_type_name (uint8_t stream_type)
1731 {
1732     return st2codec[stream_type].name? st2codec[stream_type].name : "Unknown";
1733 }
1734
1735 int decode_program_map(hb_stream_t* stream)
1736 {
1737     bitbuf_t bb;
1738         set_buf(&bb, stream->pmt_info.tablebuf, stream->pmt_info.tablepos, 0);
1739
1740     get_bits(&bb, 8);  // table_id
1741     get_bits(&bb, 4);
1742     unsigned int section_length = get_bits(&bb, 12);
1743     stream->pmt_info.section_length = section_length;
1744
1745     unsigned int program_number = get_bits(&bb, 16);
1746     stream->pmt_info.program_number = program_number;
1747     get_bits(&bb, 2);
1748     get_bits(&bb, 5);  // version_number
1749     get_bits(&bb, 1);
1750     get_bits(&bb, 8);  // section_number
1751     get_bits(&bb, 8);  // last_section_number
1752     get_bits(&bb, 3);
1753     unsigned int PCR_PID = get_bits(&bb, 13);
1754     stream->pmt_info.PCR_PID = PCR_PID;
1755     get_bits(&bb, 4);
1756     unsigned int program_info_length = get_bits(&bb, 12);
1757     stream->pmt_info.program_info_length = program_info_length;
1758
1759         int i=0;
1760         unsigned char *descriptor_buf = (unsigned char *) malloc(program_info_length);
1761         for (i = 0; i < program_info_length; i++)
1762         {
1763           descriptor_buf[i] = get_bits(&bb, 8);
1764         }
1765
1766         int cur_pos =  9 /* data after the section length field*/ + program_info_length;
1767         int done_reading_stream_types = 0;
1768         while (!done_reading_stream_types)
1769     {
1770         unsigned char stream_type = get_bits(&bb, 8);
1771         get_bits(&bb, 3);
1772         unsigned int elementary_PID = get_bits(&bb, 13);
1773         get_bits(&bb, 4);
1774         unsigned int ES_info_length = get_bits(&bb, 12);
1775
1776         int i=0;
1777         unsigned char *ES_info_buf = (unsigned char *) malloc(ES_info_length);
1778         for (i=0; i < ES_info_length; i++)
1779         {
1780             ES_info_buf[i] = get_bits(&bb, 8);
1781         }
1782
1783
1784         if ( index_of_pid( elementary_PID, stream ) < 0 )
1785         {
1786             // already have this pid - do nothing
1787         }
1788         if (stream->ts_number_video_pids == 0 && st2codec[stream_type].kind == V )
1789         {
1790             stream->ts_video_pids[0] = elementary_PID;
1791             stream->ts_stream_type[0] = stream_type;
1792             stream->ts_number_video_pids = 1;
1793         }
1794         else
1795         {
1796             // Defined audio stream types are 0x81 for AC-3/A52 audio and 0x03
1797             // for mpeg audio. But content producers seem to use other
1798             // values (0x04 and 0x06 have both been observed) so at this point
1799             // we say everything that isn't a video pid is audio then at the end
1800             // of hb_stream_title_scan we'll figure out which are really audio
1801             // by looking at the PES headers.
1802             i = stream->ts_number_audio_pids;
1803             if (i < kMaxNumberAudioPIDS)
1804             {
1805                 stream->ts_audio_pids[i] = elementary_PID;
1806                 stream->ts_stream_type[1 + i] = stream_type;
1807                 if (ES_info_length > 0)
1808                 {
1809                     decode_element_descriptors(stream, i, ES_info_buf,
1810                                                ES_info_length);
1811                 }
1812                 ++stream->ts_number_audio_pids;
1813             }
1814         }
1815
1816         cur_pos += 5 /* stream header */ + ES_info_length;
1817
1818         free(ES_info_buf);
1819
1820         if (cur_pos >= section_length - 4 /* stop before the CRC */)
1821         done_reading_stream_types = 1;
1822     }
1823
1824         free(descriptor_buf);
1825         return 1;
1826 }
1827
1828 static int build_program_map(const uint8_t *buf, hb_stream_t *stream)
1829 {
1830     // Get adaption header info
1831     int adapt_len = 0;
1832     int adaption = (buf[3] & 0x30) >> 4;
1833     if (adaption == 0)
1834             return 0;
1835     else if (adaption == 0x2)
1836             adapt_len = 184;
1837     else if (adaption == 0x3)
1838             adapt_len = buf[4] + 1;
1839     if (adapt_len > 184)
1840             return 0;
1841
1842     // Get payload start indicator
1843     int start;
1844     start = (buf[1] & 0x40) != 0;
1845
1846     // Get pointer length - only valid in packets with a start flag
1847     int pointer_len = 0;
1848
1849         if (start)
1850         {
1851                 pointer_len = buf[4 + adapt_len] + 1;
1852                 stream->pmt_info.tablepos = 0;
1853         }
1854         // Get Continuity Counter
1855         int continuity_counter = buf[3] & 0x0f;
1856         if (!start && (stream->pmt_info.current_continuity_counter + 1 != continuity_counter))
1857         {
1858                 hb_log("build_program_map - Continuity Counter %d out of sequence - expected %d", continuity_counter, stream->pmt_info.current_continuity_counter+1);
1859                 return 0;
1860         }
1861         stream->pmt_info.current_continuity_counter = continuity_counter;
1862         stream->pmt_info.reading |= start;
1863
1864     // Add the payload for this packet to the current buffer
1865         int amount_to_copy = 184 - adapt_len - pointer_len;
1866     if (stream->pmt_info.reading && (amount_to_copy > 0))
1867     {
1868                         stream->pmt_info.tablebuf = realloc(stream->pmt_info.tablebuf, stream->pmt_info.tablepos + amount_to_copy);
1869
1870             memcpy(stream->pmt_info.tablebuf + stream->pmt_info.tablepos, buf + 4 + adapt_len + pointer_len, amount_to_copy);
1871             stream->pmt_info.tablepos += amount_to_copy;
1872     }
1873     if (stream->pmt_info.tablepos > 3)
1874     {
1875         // We have enough to check the section length
1876         int length;
1877         length = ((stream->pmt_info.tablebuf[1] << 8) + 
1878                   stream->pmt_info.tablebuf[2]) & 0xFFF;
1879         if (stream->pmt_info.tablepos > length + 1)
1880         {
1881             // We just finished a bunch of packets - parse the program map details
1882             int decode_ok = 0;
1883             if (stream->pmt_info.tablebuf[0] == 0x02)
1884                 decode_ok = decode_program_map(stream);
1885             free(stream->pmt_info.tablebuf);
1886             stream->pmt_info.tablebuf = NULL;
1887             stream->pmt_info.tablepos = 0;
1888             stream->pmt_info.reading = 0;
1889             if (decode_ok)
1890                 return decode_ok;
1891         }
1892
1893     }
1894
1895     return 0;
1896 }
1897
1898 static int decode_PAT(const uint8_t *buf, hb_stream_t *stream)
1899 {
1900     unsigned char tablebuf[1024];
1901     unsigned int tablepos = 0;
1902
1903     int reading = 0;
1904
1905
1906     // Get adaption header info
1907     int adapt_len = 0;
1908     int adaption = (buf[3] & 0x30) >> 4;
1909     if (adaption == 0)
1910             return 0;
1911     else if (adaption == 0x2)
1912             adapt_len = 184;
1913     else if (adaption == 0x3)
1914             adapt_len = buf[4] + 1;
1915     if (adapt_len > 184)
1916             return 0;
1917
1918     // Get pointer length
1919     int pointer_len = buf[4 + adapt_len] + 1;
1920
1921     // Get payload start indicator
1922     int start;
1923     start = (buf[1] & 0x40) != 0;
1924
1925     if (start)
1926             reading = 1;
1927
1928     // Add the payload for this packet to the current buffer
1929     if (reading && (184 - adapt_len) > 0)
1930     {
1931             if (tablepos + 184 - adapt_len - pointer_len > 1024)
1932             {
1933                     hb_log("decode_PAT - Bad program section length (> 1024)");
1934                     return 0;
1935             }
1936             memcpy(tablebuf + tablepos, buf + 4 + adapt_len + pointer_len, 184 - adapt_len - pointer_len);
1937             tablepos += 184 - adapt_len - pointer_len;
1938     }
1939
1940     if (start && reading)
1941     {
1942             memcpy(tablebuf + tablepos, buf + 4 + adapt_len + 1, pointer_len - 1);
1943
1944
1945             unsigned int pos = 0;
1946             //while (pos < tablepos)
1947             {
1948                     bitbuf_t bb;
1949                     set_buf(&bb, tablebuf + pos, tablepos - pos, 0);
1950
1951                     unsigned char section_id    = get_bits(&bb, 8);
1952                     get_bits(&bb, 4);
1953                     unsigned int section_len    = get_bits(&bb, 12);
1954                     get_bits(&bb, 16); // transport_id
1955                     get_bits(&bb, 2);
1956                     get_bits(&bb, 5);  // version_num
1957                     get_bits(&bb, 1);  // current_next
1958                     get_bits(&bb, 8);  // section_num
1959                     get_bits(&bb, 8);  // last_section
1960
1961                     switch (section_id)
1962                     {
1963                       case 0x00:
1964                         {
1965                           // Program Association Section
1966                           section_len -= 5;    // Already read transport stream ID, version num, section num, and last section num
1967                           section_len -= 4;   // Ignore the CRC
1968                           int curr_pos = 0;
1969                                                   stream->ts_number_pat_entries = 0;
1970                           while ((curr_pos < section_len) && (stream->ts_number_pat_entries < kMaxNumberPMTStreams))
1971                           {
1972                             unsigned int pkt_program_num = get_bits(&bb, 16);
1973                                                         stream->pat_info[stream->ts_number_pat_entries].program_number = pkt_program_num;
1974
1975                             get_bits(&bb, 3);  // Reserved
1976                             if (pkt_program_num == 0)
1977                             {
1978                               get_bits(&bb, 13); // pkt_network_id
1979                             }
1980                             else
1981                             {
1982                               unsigned int pkt_program_map_PID = get_bits(&bb, 13);
1983                                 stream->pat_info[stream->ts_number_pat_entries].program_map_PID = pkt_program_map_PID;
1984                             }
1985                             curr_pos += 4;
1986                                                         stream->ts_number_pat_entries++;
1987                           }
1988                         }
1989                         break;
1990                       case 0xC7:
1991                             {
1992                                     break;
1993                             }
1994                       case 0xC8:
1995                             {
1996                                     break;
1997                             }
1998                     }
1999
2000                     pos += 3 + section_len;
2001             }
2002
2003             tablepos = 0;
2004     }
2005     return 1;
2006 }
2007
2008 static void hb_ts_stream_find_pids(hb_stream_t *stream)
2009 {
2010         // align to first packet
2011     align_to_next_packet(stream);
2012
2013         // Read the Transport Stream Packets (188 bytes each) looking at first for PID 0 (the PAT PID), then decode that
2014         // to find the program map PID and then decode that to get the list of audio and video PIDs
2015
2016         for (;;)
2017         {
2018         const uint8_t *buf = next_packet( stream );
2019
2020         if ( buf == NULL )
2021         {
2022                         hb_log("hb_ts_stream_find_pids - end of file");
2023                         break;
2024                 }
2025
2026                 // Get pid
2027                 int pid = (((buf[1] & 0x1F) << 8) | buf[2]) & 0x1FFF;
2028
2029         if ((pid == 0x0000) && (stream->ts_number_pat_entries == 0))
2030                 {
2031                   decode_PAT(buf, stream);
2032                   continue;
2033                 }
2034
2035                 int pat_index = 0;
2036                 for (pat_index = 0; pat_index < stream->ts_number_pat_entries; pat_index++)
2037                 {
2038                         // There are some streams where the PAT table has multiple entries as if their are
2039                         // multiple programs in the same transport stream, and yet there's actually only one
2040                         // program really in the stream. This seems to be true for transport streams that
2041                         // originate in the HDHomeRun but have been output by EyeTV's export utility. What I think
2042                         // is happening is that the HDHomeRun is sending the entire transport stream as broadcast,
2043                         // but the EyeTV is only recording a single (selected) program number and not rewriting the
2044                         // PAT info on export to match what's actually on the stream.
2045                         // Until we have a way of handling multiple programs per transport stream elegantly we'll match
2046                         // on the first pat entry for which we find a matching program map PID.  The ideal solution would
2047                         // be to build a title choice popup from the PAT program number details and then select from
2048                         // their - but right now the API's not capable of that.
2049             if (stream->pat_info[pat_index].program_number != 0 &&
2050                 pid == stream->pat_info[pat_index].program_map_PID)
2051                         {
2052                           if (build_program_map(buf, stream) > 0)
2053                                 break;
2054                         }
2055                 }
2056                 // Keep going  until we have a complete set of PIDs
2057                 if ((stream->ts_number_video_pids > 0) && (stream->ts_number_audio_pids > 0))
2058                   break;
2059         }
2060
2061         hb_log("hb_ts_stream_find_pids - found the following PIDS");
2062         hb_log("    Video PIDS : ");
2063     int i;
2064         for (i=0; i < stream->ts_number_video_pids; i++)
2065         {
2066         hb_log( "      0x%x type %s (0x%x)", 
2067                 stream->ts_video_pids[i],
2068                 stream_type_name(stream->ts_stream_type[i]),
2069                 stream->ts_stream_type[i]);
2070         }
2071         hb_log("    Audio PIDS : ");
2072         for (i = 0; i < stream->ts_number_audio_pids; i++)
2073         {
2074         hb_log( "      0x%x type %s (0x%x)", 
2075                 stream->ts_audio_pids[i],
2076                 stream_type_name(stream->ts_stream_type[i+1]),
2077                 stream->ts_stream_type[i+1] );
2078         }
2079  }
2080
2081
2082 static void fwrite64( hb_stream_t *stream, void *buf, int len )
2083 {
2084     if ( len > 0 )
2085     {
2086         int pos = stream->fwrite_buf->size;
2087         if ( pos + len > stream->fwrite_buf->alloc )
2088         {
2089             int size = MAX(stream->fwrite_buf->alloc * 2, pos + len);
2090             hb_buffer_realloc(stream->fwrite_buf, size);
2091         }
2092         memcpy( &(stream->fwrite_buf->data[pos]), buf, len );
2093         stream->fwrite_buf->size += len;
2094     }
2095 }
2096
2097 // convert a PES PTS or DTS to an int64
2098 static int64_t pes_timestamp( const uint8_t *pes )
2099 {
2100     int64_t ts = ( (uint64_t)(pes[0] & 0xe ) << 29 );
2101     ts |= ( pes[1] << 22 ) | ( ( pes[2] >> 1 ) << 15 ) |
2102           ( pes[3] << 7 ) | ( pes[4] >> 1 );
2103     return ts;
2104 }
2105
2106 static void generate_output_data(hb_stream_t *stream, int curstream)
2107 {
2108     hb_buffer_t *buf = stream->fwrite_buf;
2109     uint8_t *tdat = stream->ts_buf[curstream]->data;
2110
2111     buf->id = curstream;
2112
2113     // check if this packet was referenced to an older pcr and if that
2114     // pcr was significantly different than the one we're using now.
2115     // (the reason for the uint cast on the pcr difference is that the
2116     // difference is significant if it advanced by more than 200ms or if
2117     // it went backwards by any amount. The negative numbers look like huge
2118     // unsigned ints so the cast allows both conditions to be checked at once.
2119     int bufpcr = stream->ts_buf[curstream]->cur;
2120     int curpcr = stream->ts_pcr_out;
2121     if ( bufpcr && bufpcr < curpcr &&
2122          (uint64_t)(stream->ts_pcrhist[curpcr & 3] - stream->ts_pcrhist[bufpcr & 3]) > 200*90LL )
2123     {
2124         // we've sent up a new pcr but have a packet referenced to an
2125         // old pcr and the difference was enough to trigger a discontinuity
2126         // correction. smash the timestamps or we'll mess up the correction.
2127         buf->start = -1;
2128         buf->renderOffset = -1;
2129     }
2130     else
2131     {
2132         if ( stream->ts_pcr_out != stream->ts_pcr_in )
2133         {
2134             // we have a new pcr
2135             stream->ts_pcr_out = stream->ts_pcr_in;
2136             buf->stop = stream->ts_pcr;
2137             stream->ts_pcrhist[stream->ts_pcr_out & 3] = stream->ts_pcr;
2138         }
2139         else
2140         {
2141             buf->stop = -1;
2142         }
2143
2144         // put the PTS & possible DTS into 'start' & 'renderOffset' then strip
2145         // off the PES header.
2146         if ( tdat[7] & 0xc0 )
2147         {
2148             buf->start = pes_timestamp( tdat + 9 );
2149             buf->renderOffset = ( tdat[7] & 0x40 )? pes_timestamp( tdat + 14 ) :
2150                                                     buf->start;
2151         }
2152         else
2153         {
2154             buf->start = -1;
2155             buf->renderOffset = -1;
2156         }
2157     }
2158     int hlen = tdat[8] + 9;
2159
2160     fwrite64( stream,  tdat + hlen, stream->ts_pos[curstream] - hlen );
2161
2162     stream->ts_pos[curstream] = 0;
2163     stream->ts_buf[curstream]->size = 0;
2164 }
2165
2166 static void hb_ts_stream_append_pkt(hb_stream_t *stream, int idx, const uint8_t *buf, int len)
2167 {
2168     if (stream->ts_pos[idx] + len > stream->ts_buf[idx]->alloc)
2169     {
2170         int size;
2171
2172         size = MAX(stream->ts_buf[idx]->alloc * 2, stream->ts_pos[idx] + len);
2173         hb_buffer_realloc(stream->ts_buf[idx], size);
2174     }
2175     memcpy(stream->ts_buf[idx]->data + stream->ts_pos[idx], buf, len);
2176     stream->ts_pos[idx] += len;
2177     stream->ts_buf[idx]->size += len;
2178 }
2179
2180 /***********************************************************************
2181  * hb_ts_stream_decode
2182  ***********************************************************************
2183  *
2184  **********************************************************************/
2185 static int hb_ts_stream_decode( hb_stream_t *stream, hb_buffer_t *obuf )
2186 {
2187     /*
2188      * stash the output buffer pointer in our stream so we don't have to
2189      * pass it & its original value to everything we call.
2190      */
2191     obuf->size = 0;
2192     stream->fwrite_buf = obuf;
2193
2194         // spin until we get a packet of data from some stream or hit eof
2195         while ( 1 )
2196         {
2197         int curstream;
2198
2199         const uint8_t *buf = next_packet(stream);
2200         if ( buf == NULL )
2201         {
2202             // end of file - we didn't finish filling our ps write buffer
2203             // so just discard the remainder (the partial buffer is useless)
2204             hb_log("hb_ts_stream_decode - eof");
2205             return 0;
2206                 }
2207
2208         /* This next section validates the packet */
2209
2210                 // Get pid and use it to find stream state.
2211                 int pid = ((buf[1] & 0x1F) << 8) | buf[2];
2212         if ( ( curstream = index_of_pid( pid, stream ) ) < 0 )
2213             continue;
2214
2215                 // Get error
2216                 int errorbit = (buf[1] & 0x80) != 0;
2217                 if (errorbit)
2218                 {
2219                         ts_err( stream, curstream,  "packet error bit set");
2220                         continue;
2221                 }
2222
2223                 // Get adaption header info
2224                 int adaption = (buf[3] & 0x30) >> 4;
2225                 int adapt_len = 0;
2226                 if (adaption == 0)
2227                 {
2228                         ts_err( stream, curstream,  "adaptation code 0");
2229                         continue;
2230                 }
2231                 else if (adaption == 0x2)
2232                         adapt_len = 184;
2233                 else if (adaption == 0x3)
2234                 {
2235                         adapt_len = buf[4] + 1;
2236                         if (adapt_len > 184)
2237                         {
2238                                 ts_err( stream, curstream,  "invalid adapt len %d", adapt_len);
2239                 continue;
2240                         }
2241                 }
2242
2243         if ( adapt_len > 0 )
2244         {
2245             if ( buf[5] & 0x40 )
2246             {
2247                 // found a random access point
2248             }
2249             // if there's an adaptation header & PCR_flag is set
2250             // get the PCR (Program Clock Reference)
2251             if ( adapt_len > 7 && ( buf[5] & 0x10 ) != 0 )
2252             {
2253                 stream->ts_pcr = ( (uint64_t)buf[6] << (33 - 8) ) |
2254                                  ( (uint64_t)buf[7] << (33 - 16) ) |
2255                                  ( (uint64_t)buf[8] << (33 - 24) ) |
2256                                  ( (uint64_t)buf[9] << (33 - 32) ) |
2257                                  ( buf[10] >> 7 );
2258                 ++stream->ts_pcr_in;
2259                 stream->ts_found_pcr = 1;
2260             }
2261         }
2262
2263         // If we don't have a PCR yet but the stream has PCRs just loop
2264         // so we don't process anything until we have a clock reference.
2265         // Unfortunately the HD Home Run appears to null out the PCR so if
2266         // we didn't detect a PCR during scan keep going and we'll use
2267         // the video stream DTS for the PCR.
2268
2269         if ( !stream->ts_found_pcr && ( stream->ts_flags & TS_HAS_PCR ) )
2270         {
2271             continue;
2272         }
2273
2274                 // Get continuity
2275         // Continuity only increments for adaption values of 0x3 or 0x01
2276         // and is not checked for start packets.
2277
2278                 int start = (buf[1] & 0x40) != 0;
2279
2280         if ( (adaption & 0x01) != 0 )
2281                 {
2282             int continuity = (buf[3] & 0xF);
2283             if ( continuity == stream->ts_streamcont[curstream] )
2284             {
2285                 // we got a duplicate packet (usually used to introduce
2286                 // a PCR when one is needed). The only thing that can
2287                 // change in the dup is the PCR which we grabbed above
2288                 // so ignore the rest.
2289                 continue;
2290             }
2291             if ( !start && (stream->ts_streamcont[curstream] != -1) &&
2292                  !stream->ts_skipbad[curstream] &&
2293                  (continuity != ( (stream->ts_streamcont[curstream] + 1) & 0xf ) ) )
2294                         {
2295                                 ts_err( stream, curstream,  "continuity error: got %d expected %d",
2296                         (int)continuity,
2297                         (stream->ts_streamcont[curstream] + 1) & 0xf );
2298                 stream->ts_streamcont[curstream] = continuity;
2299                                 continue;
2300                         }
2301                         stream->ts_streamcont[curstream] = continuity;
2302                 }
2303
2304         /* If we get here the packet is valid - process its data */
2305
2306         if ( start )
2307         {
2308             // Found a random access point (now we can start a frame/audio packet..)
2309
2310             if ( stream->need_keyframe )
2311             {
2312                 // we're looking for the first video frame because we're
2313                 // doing random access during 'scan'
2314                 if ( curstream != 0 || !isIframe( stream, buf, adapt_len ) )
2315                 {
2316                     // not the video stream or didn't find an I frame
2317                     // but we'll only wait 255 video frames for an I frame.
2318                     if ( curstream != 0 || ++stream->need_keyframe )
2319                     {
2320                         continue;
2321                     }
2322                 }
2323                 stream->need_keyframe = 0;
2324             }
2325
2326                         // If we were skipping a bad packet, start fresh on this new PES packet..
2327                         if (stream->ts_skipbad[curstream] == 1)
2328                         {
2329                                 stream->ts_skipbad[curstream] = 0;
2330                         }
2331
2332                         if ( curstream == 0 )
2333             {
2334                 ++stream->frames;
2335
2336                 // if we don't have a pcr yet use the dts from this frame
2337                 if ( !stream->ts_found_pcr )
2338                 {
2339                     // PES must begin with an mpeg start code & contain
2340                     // a DTS or PTS.
2341                     const uint8_t *pes = buf + adapt_len + 4;
2342                     if ( pes[0] != 0x00 || pes[1] != 0x00 || pes[2] != 0x01 ||
2343                          ( pes[7] >> 6 ) == 0 )
2344                     {
2345                         continue;
2346                     }
2347                     // if we have a dts use it otherwise use the pts
2348                     stream->ts_pcr = pes_timestamp( pes + ( pes[7] & 0x40? 14 : 9 ) );
2349                     ++stream->ts_pcr_in;
2350                 }
2351             }
2352
2353             // if this is a multiplexed stream make sure this is the
2354             // substream we want.
2355             if ( stream->ts_multiplexed[curstream] )
2356             {
2357                 // PES must begin with an mpeg start code & contain
2358                 // a DTS or PTS.
2359                 const uint8_t *pes = buf + adapt_len + 4;
2360                 if ( pes[0] != 0x00 || pes[1] != 0x00 || pes[2] != 0x01 ||
2361                      pes[3] != 0xfd )
2362                 {
2363                     stream->ts_skipbad[curstream] = 1;
2364                     continue;
2365                 }
2366                 // the last byte of the header is the extension id. see if
2367                 // it's the one we want.
2368                 if ( pes[pes[8]+8] != stream->ts_multiplexed[curstream] )
2369                 {
2370                     stream->ts_skipbad[curstream] = 1;
2371                     continue;
2372                 }
2373             }
2374
2375             // If we have some data already on this stream, turn it into
2376             // a program stream packet. Then add the payload for this
2377             // packet to the current pid's buffer.
2378             if ( stream->ts_pos[curstream] )
2379             {
2380                 // we have to ship the old packet before updating the pcr
2381                 // since the packet we've been accumulating is referenced
2382                 // to the old pcr.
2383                 generate_output_data(stream, curstream);
2384
2385                 // remember the pcr that was in effect when we started
2386                 // this packet.
2387                 stream->ts_buf[curstream]->cur = stream->ts_pcr_in;
2388                 hb_ts_stream_append_pkt(stream, curstream, buf + 4 + adapt_len,
2389                                         184 - adapt_len);
2390                 return 1;
2391             }
2392             // remember the pcr that was in effect when we started this packet.
2393             stream->ts_buf[curstream]->cur = stream->ts_pcr_in;
2394         }
2395
2396                 // Add the payload for this packet to the current buffer
2397                 if (!stream->ts_skipbad[curstream] && (184 - adapt_len) > 0)
2398                 {
2399             hb_ts_stream_append_pkt(stream, curstream, buf + 4 + adapt_len,
2400                                     184 - adapt_len);
2401             // see if we've hit the end of this PES packet
2402             const uint8_t *pes = stream->ts_buf[curstream]->data;
2403             int len = ( pes[4] << 8 ) + pes[5] + 6;
2404             if ( len > 6 && stream->ts_pos[curstream] == len &&
2405                  pes[0] == 0x00 && pes[1] == 0x00 && pes[2] == 0x01 )
2406             {
2407                 generate_output_data(stream, curstream);
2408                 return 1;
2409             }
2410                 }
2411         }
2412 }
2413
2414 static void hb_ts_stream_reset(hb_stream_t *stream)
2415 {
2416         int i;
2417
2418         for (i=0; i < kMaxNumberDecodeStreams; i++)
2419         {
2420                 stream->ts_pos[i] = 0;
2421                 stream->ts_skipbad[i] = 1;
2422                 stream->ts_streamcont[i] = -1;
2423         }
2424
2425     stream->need_keyframe = 0;
2426
2427     stream->ts_found_pcr = 0;
2428     stream->ts_pcr_out = 0;
2429     stream->ts_pcr_in = 0;
2430     stream->ts_pcr = 0;
2431
2432     stream->frames = 0;
2433     stream->errors = 0;
2434     stream->last_error_frame = -10000;
2435     stream->last_error_count = 0;
2436
2437     align_to_next_packet(stream);
2438 }
2439
2440 // ------------------------------------------------------------------
2441 // Support for reading media files via the ffmpeg libraries.
2442
2443 static void ffmpeg_add_codec( hb_stream_t *stream, int stream_index )
2444 {
2445     // add a codec to the context here so it will be there when we
2446     // read the first packet.
2447     AVCodecContext *context = stream->ffmpeg_ic->streams[stream_index]->codec;
2448     context->workaround_bugs = FF_BUG_AUTODETECT;
2449     context->error_recognition = 1;
2450     context->error_concealment = FF_EC_GUESS_MVS|FF_EC_DEBLOCK;
2451     AVCodec *codec = avcodec_find_decoder( context->codec_id );
2452     hb_avcodec_open( context, codec );
2453 }
2454
2455 // The ffmpeg stream reader / parser shares a lot of state with the 
2456 // decoder via a codec context kept in the AVStream of the reader's
2457 // AVFormatContext. Since decoding is done in a different thread we
2458 // have to somehow pass this codec context to the decoder and we have
2459 // to do it before the first packet is read (so we can't put the info
2460 // in the buf we'll send downstream). Decoders don't have any way to
2461 // get to the stream directly (they're not passed the title or job
2462 // pointers during a scan) so this is a back door for the decoder to
2463 // get the codec context. We just stick the stream pointer in the next
2464 // slot an array of pointers maintained as a circular list then return
2465 // the index into the list combined with the ffmpeg stream index as the
2466 // codec_param that will be passed to the decoder init routine. We make
2467 // the list 'big' (enough for 1024 simultaneously open ffmpeg streams)
2468 // so that we don't have to do a complicated allocator or worry about
2469 // deleting entries on close. 
2470 //
2471 // Entries can only be added to this list during a scan and are never
2472 // deleted so the list access doesn't require locking.
2473 static hb_stream_t **ffmpeg_streams;    // circular list of stream pointers
2474 static int ffmpeg_stream_cur;           // where we put the last stream pointer
2475 #define ffmpeg_sl_bits (10)             // log2 stream list size (in entries)
2476 #define ffmpeg_sl_size (1 << ffmpeg_sl_bits)
2477
2478 // add a stream to the list & return the appropriate codec_param to access it
2479 static int ffmpeg_codec_param( hb_stream_t *stream, int stream_index )
2480 {
2481     if ( !ffmpeg_streams )
2482     {
2483         ffmpeg_streams = calloc( ffmpeg_sl_size, sizeof(stream) );
2484     }
2485
2486     // the title scan adds all the ffmpeg media streams at once so we
2487     // only add a new entry to our stream list if the stream is different
2488     // than last time.
2489     int slot = ffmpeg_stream_cur;
2490     if ( ffmpeg_streams[slot] != stream )
2491     {
2492         // new stream - put it in the next slot of the stream list
2493         slot = ++ffmpeg_stream_cur & (ffmpeg_sl_size - 1);
2494         ffmpeg_streams[slot] = stream;
2495     }
2496
2497     ffmpeg_add_codec( stream, stream_index );
2498
2499     return ( stream_index << ffmpeg_sl_bits ) | slot;
2500 }
2501
2502 // we're about to open 'title' to convert it - remap the stream associated
2503 // with the video & audio codec params of the title to refer to 'stream'
2504 // (the original scan stream was closed and no longer exists).
2505 static void ffmpeg_remap_stream( hb_stream_t *stream, hb_title_t *title )
2506 {
2507     // tell ffmpeg we want a pts on every frame it returns
2508     stream->ffmpeg_ic->flags |= AVFMT_FLAG_GENPTS;
2509
2510     // all the video & audio came from the same stream so remapping
2511     // the video's stream slot takes care of everything.
2512     int slot = title->video_codec_param & (ffmpeg_sl_size - 1);
2513     ffmpeg_streams[slot] = stream;
2514
2515     // add codecs for all the streams used by the title
2516     ffmpeg_add_codec( stream, title->video_codec_param >> ffmpeg_sl_bits );
2517
2518     int i;
2519     hb_audio_t *audio;
2520     for ( i = 0; ( audio = hb_list_item( title->list_audio, i ) ); ++i )
2521     {
2522         if ( audio->config.in.codec == HB_ACODEC_FFMPEG )
2523         {
2524             ffmpeg_add_codec( stream,
2525                               audio->config.in.codec_param >> ffmpeg_sl_bits );
2526         }
2527     }
2528 }
2529
2530 void *hb_ffmpeg_context( int codec_param )
2531 {
2532     int slot = codec_param & (ffmpeg_sl_size - 1);
2533     int stream_index = codec_param >> ffmpeg_sl_bits;
2534     return ffmpeg_streams[slot]->ffmpeg_ic->streams[stream_index]->codec;
2535 }
2536
2537 void *hb_ffmpeg_avstream( int codec_param )
2538 {
2539     int slot = codec_param & (ffmpeg_sl_size - 1);
2540     int stream_index = codec_param >> ffmpeg_sl_bits;
2541     return ffmpeg_streams[slot]->ffmpeg_ic->streams[stream_index];
2542 }
2543
2544 static AVFormatContext *ffmpeg_deferred_close;
2545
2546 static int ffmpeg_open( hb_stream_t *stream, hb_title_t *title )
2547 {
2548     if ( ffmpeg_deferred_close )
2549     {
2550         av_close_input_file( ffmpeg_deferred_close );
2551         ffmpeg_deferred_close = NULL;
2552     }
2553     AVFormatContext *ic;
2554
2555     av_log_set_level( AV_LOG_ERROR );
2556     if ( av_open_input_file( &ic, stream->path, NULL, 0, NULL ) < 0 )
2557     {
2558         return 0;
2559     }
2560     if ( av_find_stream_info( ic ) < 0 )
2561         goto fail;
2562
2563     stream->ffmpeg_ic = ic;
2564     stream->hb_stream_type = ffmpeg;
2565     stream->ffmpeg_pkt = malloc(sizeof(*stream->ffmpeg_pkt));
2566     av_init_packet( stream->ffmpeg_pkt );
2567
2568     if ( title )
2569     {
2570         // we're opening for read. scan passed out codec params that
2571         // indexed its stream so we need to remap them so they point
2572         // to this stream.
2573         ffmpeg_remap_stream( stream, title );
2574         av_log_set_level( AV_LOG_ERROR );
2575     }
2576     else
2577     {
2578         // we're opening for scan. let ffmpeg put some info into the
2579         // log about what we've got.
2580         av_log_set_level( AV_LOG_INFO );
2581         dump_format( ic, 0, stream->path, 0 );
2582         av_log_set_level( AV_LOG_ERROR );
2583
2584         // accept this file if it has at least one video stream we can decode
2585         int i;
2586         for (i = 0; i < ic->nb_streams; ++i )
2587         {
2588             if ( ic->streams[i]->codec->codec_type == CODEC_TYPE_VIDEO )
2589             {
2590                 break;
2591             }
2592         }
2593         if ( i >= ic->nb_streams )
2594             goto fail;
2595     }
2596     return 1;
2597
2598   fail:
2599     av_close_input_file( ic );
2600     return 0;
2601 }
2602
2603 static void ffmpeg_close( hb_stream_t *d )
2604 {
2605     // XXX since we're sharing the CodecContext with the downstream
2606     // decoder proc we can't close the stream. We need to reference count
2607     // this so we can close it when both are done with their instance but
2608     // for now just defer the close until the next stream open or close.
2609     if ( ffmpeg_deferred_close )
2610     {
2611         av_close_input_file( ffmpeg_deferred_close );
2612     }
2613     ffmpeg_deferred_close = d->ffmpeg_ic;
2614     if ( d->ffmpeg_pkt != NULL )
2615     {
2616         free( d->ffmpeg_pkt );
2617         d->ffmpeg_pkt = NULL;
2618     }
2619 }
2620
2621 static void add_ffmpeg_audio( hb_title_t *title, hb_stream_t *stream, int id )
2622 {
2623     AVStream *st = stream->ffmpeg_ic->streams[id];
2624     AVCodecContext *codec = st->codec;
2625
2626     // scan will ignore any audio without a bitrate. Since we've already
2627     // typed the audio in order to determine its codec we set up the audio
2628     // paramters here.
2629     if ( codec->bit_rate || codec->sample_rate )
2630     {
2631         static const int chan2layout[] = {
2632             HB_INPUT_CH_LAYOUT_MONO,  // We should allow no audio really.
2633             HB_INPUT_CH_LAYOUT_MONO,   
2634             HB_INPUT_CH_LAYOUT_STEREO,
2635             HB_INPUT_CH_LAYOUT_2F1R,   
2636             HB_INPUT_CH_LAYOUT_2F2R,
2637             HB_INPUT_CH_LAYOUT_3F2R,   
2638             HB_INPUT_CH_LAYOUT_4F2R,
2639             HB_INPUT_CH_LAYOUT_STEREO, 
2640             HB_INPUT_CH_LAYOUT_STEREO,
2641         };
2642
2643         hb_audio_t *audio = calloc( 1, sizeof(*audio) );;
2644
2645         audio->id = id;
2646         if ( codec->codec_id == CODEC_ID_AC3 )
2647         {
2648             audio->config.in.codec = HB_ACODEC_AC3;
2649         }
2650         else if ( codec->codec_id == CODEC_ID_DTS )
2651         {
2652             audio->config.in.codec = HB_ACODEC_DCA;
2653         }
2654         else
2655         {
2656             audio->config.in.codec = HB_ACODEC_FFMPEG;
2657             audio->config.in.codec_param = ffmpeg_codec_param( stream, id );
2658
2659             audio->config.in.bitrate = codec->bit_rate? codec->bit_rate : 1;
2660             audio->config.in.samplerate = codec->sample_rate;
2661             audio->config.in.channel_layout = chan2layout[codec->channels & 7];
2662         }
2663
2664         set_audio_description( audio, lang_for_code2( st->language ) );
2665
2666         hb_list_add( title->list_audio, audio );
2667     }
2668 }
2669
2670 static hb_title_t *ffmpeg_title_scan( hb_stream_t *stream )
2671 {
2672     AVFormatContext *ic = stream->ffmpeg_ic;
2673
2674     // 'Barebones Title'
2675     hb_title_t *title = hb_title_init( stream->path, 0 );
2676     title->index = 1;
2677
2678         // Copy part of the stream path to the title name
2679         char *sep = strrchr(stream->path, '/');
2680         if (sep)
2681                 strcpy(title->name, sep+1);
2682         char *dot_term = strrchr(title->name, '.');
2683         if (dot_term)
2684                 *dot_term = '\0';
2685
2686     uint64_t dur = ic->duration * 90000 / AV_TIME_BASE;
2687     title->duration = dur;
2688     dur /= 90000;
2689     title->hours    = dur / 3600;
2690     title->minutes  = ( dur % 3600 ) / 60;
2691     title->seconds  = dur % 60;
2692
2693     // set the title to decode the first video stream in the file
2694     title->demuxer = HB_NULL_DEMUXER;
2695     title->video_codec = 0;
2696     int i;
2697     for (i = 0; i < ic->nb_streams; ++i )
2698     {
2699         if ( ic->streams[i]->codec->codec_type == CODEC_TYPE_VIDEO &&
2700              avcodec_find_decoder( ic->streams[i]->codec->codec_id ) &&
2701              title->video_codec == 0 )
2702         {
2703             title->video_id = i;
2704             stream->ffmpeg_video_id = i;
2705
2706             // We have to use the 'internal' avcodec decoder because
2707             // it needs to share the codec context from this video
2708             // stream. The parser internal to av_read_frame
2709             // passes a bunch of state info to the decoder via the context.
2710             title->video_codec = WORK_DECAVCODECVI;
2711             title->video_codec_param = ffmpeg_codec_param( stream, i );
2712         }
2713         else if ( ic->streams[i]->codec->codec_type == CODEC_TYPE_AUDIO &&
2714                   avcodec_find_decoder( ic->streams[i]->codec->codec_id ) )
2715         {
2716             add_ffmpeg_audio( title, stream, i );
2717         }
2718     }
2719
2720     title->container_name = strdup( ic->iformat->name );
2721     title->data_rate = ic->bit_rate;
2722
2723     hb_deep_log( 2, "Found ffmpeg %d chapters, container=%s", ic->nb_chapters, ic->iformat->name );
2724
2725     if( ic->nb_chapters != 0 )
2726     {
2727         AVChapter *m;
2728         uint64_t duration_sum = 0;
2729         for( i = 0; i < ic->nb_chapters; i++ )
2730             if( m = ic->chapters[i] )
2731             {
2732                 hb_chapter_t * chapter;
2733                 chapter = calloc( sizeof( hb_chapter_t ), 1 );
2734                 chapter->index    = i+1;
2735                 chapter->duration = ( m->end / ( (double) m->time_base.num * m->time_base.den ) ) * 90000  - duration_sum;
2736                 duration_sum     += chapter->duration;
2737                 chapter->hours    = chapter->duration / 90000 / 3600;
2738                 chapter->minutes  = ( ( chapter->duration / 90000 ) % 3600 ) / 60;
2739                 chapter->seconds  = ( chapter->duration / 90000 ) % 60;
2740                 strcpy( chapter->title, m->title );
2741                 hb_deep_log( 2, "Added chapter %i, name='%s', dur=%llu, (%02i:%02i:%02i)",
2742                             chapter->index, chapter->title,
2743                             chapter->duration, chapter->hours,
2744                             chapter->minutes, chapter->seconds );
2745                 hb_list_add( title->list_chapter, chapter );
2746             }
2747     }
2748
2749     /*
2750      * Fill the metadata.
2751      */
2752     decmetadata( title );
2753
2754     if( hb_list_count( title->list_chapter ) == 0 )
2755     {
2756         // Need at least one chapter
2757         hb_chapter_t * chapter;
2758         chapter = calloc( sizeof( hb_chapter_t ), 1 );
2759         chapter->index = 1;
2760         chapter->duration = title->duration;
2761         chapter->hours = title->hours;
2762         chapter->minutes = title->minutes;
2763         chapter->seconds = title->seconds;
2764         hb_list_add( title->list_chapter, chapter );
2765     }
2766
2767     return title;
2768 }
2769
2770 static int64_t av_to_hb_pts( int64_t pts, double conv_factor )
2771 {
2772     if ( pts == AV_NOPTS_VALUE )
2773         return -1;
2774     return (int64_t)( (double)pts * conv_factor );
2775 }
2776
2777 static int ffmpeg_is_keyframe( hb_stream_t *stream )
2778 {
2779     uint8_t *pkt;
2780
2781     switch ( stream->ffmpeg_ic->streams[stream->ffmpeg_video_id]->codec->codec_id )
2782     {
2783         case CODEC_ID_VC1:
2784             // XXX the VC1 codec doesn't mark key frames so to get previews
2785             // we do it ourselves here. The decoder gets messed up if it
2786             // doesn't get a SEQ header first so we consider that to be a key frame.
2787             pkt = stream->ffmpeg_pkt->data;
2788             if ( pkt[0] && pkt[1] && pkt[2] == 1 && pkt[3] == 0x0f )
2789                 return 1;
2790
2791             return 0;
2792
2793         case CODEC_ID_WMV3:
2794             // XXX the ffmpeg WMV3 codec doesn't mark key frames.
2795             // Only M$ could make I-frame detection this complicated: there
2796             // are two to four bits of unused junk ahead of the frame type
2797             // so we have to look at the sequence header to find out how much
2798             // to skip. Then there are three different ways of coding the type
2799             // depending on whether it's main or advanced profile then whether
2800             // there are bframes or not so we have to look at the sequence
2801             // header to get that.
2802             pkt = stream->ffmpeg_pkt->data;
2803             uint8_t *seqhdr = stream->ffmpeg_ic->streams[stream->ffmpeg_video_id]->codec->extradata;
2804             int pshift = 2;
2805             if ( ( seqhdr[3] & 0x02 ) == 0 )
2806                 // no FINTERPFLAG
2807                 ++pshift;
2808             if ( ( seqhdr[3] & 0x80 ) == 0 )
2809                 // no RANGEREDUCTION
2810                 ++pshift;
2811             if ( seqhdr[3] & 0x70 )
2812                 // stream has b-frames
2813                 return ( ( pkt[0] >> pshift ) & 0x3 ) == 0x01;
2814
2815             return ( ( pkt[0] >> pshift ) & 0x2 ) == 0;
2816
2817         default:
2818             break;
2819     }
2820     return ( stream->ffmpeg_pkt->flags & PKT_FLAG_KEY );
2821 }
2822
2823 static int ffmpeg_read( hb_stream_t *stream, hb_buffer_t *buf )
2824 {
2825     int err;
2826   again:
2827     if ( ( err = av_read_frame( stream->ffmpeg_ic, stream->ffmpeg_pkt )) < 0 )
2828     {
2829         // XXX the following conditional is to handle avi files that
2830         // use M$ 'packed b-frames' and occasionally have negative
2831         // sizes for the null frames these require.
2832         if ( err != AVERROR_NOMEM || stream->ffmpeg_pkt->size >= 0 )
2833             // eof
2834             return 0;
2835     }
2836     if ( stream->ffmpeg_pkt->size <= 0 )
2837     {
2838         // M$ "invalid and inefficient" packed b-frames require 'null frames'
2839         // following them to preserve the timing (since the packing puts two
2840         // or more frames in what looks like one avi frame). The contents and
2841         // size of these null frames are ignored by the ff_h263_decode_frame
2842         // as long as they're < 20 bytes. We need a positive size so we use
2843         // one byte if we're given a zero or negative size. We don't know
2844         // if the pkt data points anywhere reasonable so we just stick a
2845         // byte of zero in our outbound buf.
2846         buf->size = 1;
2847         *buf->data = 0;
2848     }
2849     else
2850     {
2851         if ( stream->ffmpeg_pkt->size > buf->alloc )
2852         {
2853             // sometimes we get absurd sizes from ffmpeg
2854             if ( stream->ffmpeg_pkt->size >= (1 << 25) )
2855             {
2856                 hb_log( "ffmpeg_read: pkt too big: %d bytes", stream->ffmpeg_pkt->size );
2857                 av_free_packet( stream->ffmpeg_pkt );
2858                 return ffmpeg_read( stream, buf );
2859             }
2860             // need to expand buffer
2861             hb_buffer_realloc( buf, stream->ffmpeg_pkt->size );
2862         }
2863         memcpy( buf->data, stream->ffmpeg_pkt->data, stream->ffmpeg_pkt->size );
2864         buf->size = stream->ffmpeg_pkt->size;
2865     }
2866     buf->id = stream->ffmpeg_pkt->stream_index;
2867     if ( buf->id == stream->ffmpeg_video_id )
2868     {
2869         if ( stream->need_keyframe )
2870         {
2871             // we've just done a seek (generally for scan or live preview) and
2872             // want to start at a keyframe. Some ffmpeg codecs seek to a key
2873             // frame but most don't. So we spin until we either get a keyframe
2874             // or we've looked through 50 video frames without finding one.
2875             if ( ! ffmpeg_is_keyframe( stream ) && ++stream->need_keyframe < 50 )
2876             {
2877                 av_free_packet( stream->ffmpeg_pkt );
2878                 goto again;
2879             }
2880             stream->need_keyframe = 0;
2881         }
2882         ++stream->frames;
2883     }
2884
2885     // if we haven't done it already, compute a conversion factor to go
2886     // from the ffmpeg timebase for the stream to HB's 90KHz timebase.
2887     double tsconv = stream->ffmpeg_tsconv[stream->ffmpeg_pkt->stream_index];
2888     if ( ! tsconv )
2889     {
2890         AVStream *s = stream->ffmpeg_ic->streams[stream->ffmpeg_pkt->stream_index];
2891         tsconv = 90000. * (double)s->time_base.num / (double)s->time_base.den;
2892         stream->ffmpeg_tsconv[stream->ffmpeg_pkt->stream_index] = tsconv;
2893     }
2894
2895     buf->start = av_to_hb_pts( stream->ffmpeg_pkt->pts, tsconv );
2896     buf->renderOffset = av_to_hb_pts( stream->ffmpeg_pkt->dts, tsconv );
2897     if ( buf->renderOffset >= 0 && buf->start == -1 )
2898     {
2899         buf->start = buf->renderOffset;
2900     }
2901
2902     /*
2903      * Check to see whether this video buffer is on a chapter
2904      * boundary, if so mark it as such in the buffer. The chapters for
2905      * a stream have a simple duration for each chapter. So we keep
2906      * track of what chapter we are in currently, and when it is due
2907      * to end.
2908      */
2909     hb_deep_log( 3, "title=0x%x, job=0x%x, chapter_markers=%d, time=%lld, chapter=%d, end_chapter=%lld",
2910                  stream->title, 
2911                  stream->title ? (stream->title->job ? stream->title->job : 0x0) : 0x0, 
2912                  stream->title ? (stream->title->job ? stream->title->job->chapter_markers : 2) : 0x0,  
2913                  buf->start, stream->chapter, stream->chapter_end);
2914
2915     if( stream->title &&
2916         stream->title->job &&
2917         stream->title->job->chapter_markers &&
2918         buf->id == stream->ffmpeg_video_id &&
2919         buf->start >= stream->chapter_end )
2920     {
2921         hb_chapter_t *chapter = NULL;
2922
2923         /*
2924          * Store when this chapter ends using HB time.
2925          */
2926         chapter = hb_list_item( stream->title->list_chapter,
2927                                 stream->chapter );
2928
2929         if( chapter )
2930         {
2931             buf->new_chap = stream->chapter + 2;
2932
2933             hb_deep_log( 2, "Starting chapter %i at %lld", buf->new_chap, buf->start);
2934             hb_chapter_t *nextChapter = NULL;
2935             nextChapter = hb_list_item( stream->title->list_chapter,
2936                                    stream->chapter + 1 );
2937             if( nextChapter )
2938                 stream->chapter_end += nextChapter->duration;
2939             stream->chapter++;
2940             hb_deep_log( 2, "Looking for chapter %i at %lld", stream->chapter + 2, stream->chapter_end );
2941         } else {
2942             /*
2943              * Must have run out of chapters, stop looking.
2944              */
2945             stream->chapter_end = -1;
2946         }
2947     } else {
2948         buf->new_chap = 0;
2949     }
2950     av_free_packet( stream->ffmpeg_pkt );
2951     return 1;
2952 }
2953
2954 static int ffmpeg_seek( hb_stream_t *stream, float frac )
2955 {
2956     AVFormatContext *ic = stream->ffmpeg_ic;
2957     if ( frac > 0. )
2958     {
2959         int64_t pos = (double)ic->duration * (double)frac;
2960         if ( ic->start_time != AV_NOPTS_VALUE )
2961         {
2962             pos += ic->start_time;
2963         }
2964         av_seek_frame( ic, -1, pos, 0 );
2965         stream->need_keyframe = 1;
2966     }
2967     else
2968     {
2969         av_seek_frame( ic, -1, 0LL, AVSEEK_FLAG_BACKWARD );
2970     }
2971     return 1;
2972 }