OSDN Git Service

don't read the entire file looking for audio in transport streams
[handbrake-jp/handbrake-jp-git.git] / libhb / stream.c
1 /* $Id$
2
3    This file is part of the HandBrake source code.
4    Homepage: <http://handbrake.fr/>.
5    It may be used under the terms of the GNU General Public License. */
6
7 #include <string.h>
8 #include <ctype.h>
9 #include <errno.h>
10
11 #include "hb.h"
12 #include "hbffmpeg.h"
13 #include "lang.h"
14 #include "a52dec/a52.h"
15 #include "mp4v2/mp4v2.h"
16
17 #define min(a, b) a < b ? a : b
18
19 /*
20  * This table defines how ISO MPEG stream type codes map to HandBrake
21  * codecs. It is indexed by the 8 bit stream type and contains the codec
22  * worker object id and a parameter for that worker proc (ignored except
23  * for the ffmpeg-based codecs in which case it is the ffmpeg codec id).
24  *
25  * Entries with a worker proc id of 0 or a kind of 'U' indicate that HB
26  * doesn't handle the stream type.
27  */
28 typedef struct {
29     enum { N, U, A, V } kind; /* not handled / unknown / audio / video */
30     int codec;          /* HB worker object id of codec */
31     int codec_param;    /* param for codec (usually ffmpeg codec id) */
32     const char* name;   /* description of type */
33 } stream2codec_t;
34
35 #define st(id, kind, codec, codec_param, name) \
36  [id] = { kind, codec, codec_param, name }
37
38 static const stream2codec_t st2codec[256] = {
39     st(0x01, V, WORK_DECMPEG2,     0,              "MPEG1"),
40     st(0x02, V, WORK_DECMPEG2,     0,              "MPEG2"),
41     st(0x03, A, HB_ACODEC_MPGA,    CODEC_ID_MP2,   "MPEG1"),
42     st(0x04, A, HB_ACODEC_MPGA,    CODEC_ID_MP2,   "MPEG2"),
43     st(0x05, N, 0,                 0,              "ISO 13818-1 private section"),
44     st(0x06, U, 0,                 0,              "ISO 13818-1 PES private data"),
45     st(0x07, N, 0,                 0,              "ISO 13522 MHEG"),
46     st(0x08, N, 0,                 0,              "ISO 13818-1 DSM-CC"),
47     st(0x09, N, 0,                 0,              "ISO 13818-1 auxiliary"),
48     st(0x0a, N, 0,                 0,              "ISO 13818-6 encap"),
49     st(0x0b, N, 0,                 0,              "ISO 13818-6 DSM-CC U-N msgs"),
50     st(0x0c, N, 0,                 0,              "ISO 13818-6 Stream descriptors"),
51     st(0x0d, N, 0,                 0,              "ISO 13818-6 Sections"),
52     st(0x0e, N, 0,                 0,              "ISO 13818-1 auxiliary"),
53     st(0x0f, A, HB_ACODEC_MPGA,    CODEC_ID_AAC,   "ISO 13818-7 AAC Audio"),
54     st(0x10, V, WORK_DECAVCODECV,  CODEC_ID_MPEG4, "MPEG4"),
55     st(0x11, A, HB_ACODEC_MPGA,    CODEC_ID_AAC_LATM, "MPEG4 LATM AAC"),
56     st(0x12, U, 0,                 0,              "MPEG4 generic"),
57
58     st(0x14, N, 0,                 0,              "ISO 13818-6 DSM-CC download"),
59
60     st(0x1b, V, WORK_DECAVCODECV,  CODEC_ID_H264,  "H.264"),
61
62     st(0x80, N, 0,                 0,              "DigiCipher II Video"),
63     st(0x81, A, HB_ACODEC_AC3,     0,              "AC-3"),
64     st(0x82, A, HB_ACODEC_DCA,     0,              "HDMV DTS"),
65     st(0x83, A, HB_ACODEC_LPCM,    0,              "LPCM"),
66     st(0x84, A, 0,                 0,              "SDDS"),
67     st(0x85, U, 0,                 0,              "ATSC Program ID"),
68     st(0x86, A, HB_ACODEC_DCA,     0,              "DTS-HD"),
69     st(0x87, A, 0,                 0,              "E-AC-3"),
70
71     st(0x8a, A, HB_ACODEC_DCA,     0,              "DTS"),
72
73     st(0x91, A, HB_ACODEC_AC3,     0,              "AC-3"),
74     st(0x92, N, 0,                 0,              "Subtitle"),
75
76     st(0x94, A, 0,                 0,              "SDDS"),
77     st(0xa0, V, 0,                 0,              "MSCODEC"),
78
79     st(0xea, V, WORK_DECAVCODECV,  CODEC_ID_VC1,   "VC1"),
80 };
81 #undef st
82
83 typedef enum {
84     hb_stream_type_unknown = 0,
85     transport,
86     program,
87     dvd_program,
88     ffmpeg
89 } hb_stream_type_t;
90
91 #define kMaxNumberVideoPIDS 1
92 #define kMaxNumberAudioPIDS 31
93 #define kMaxNumberDecodeStreams (kMaxNumberVideoPIDS+kMaxNumberAudioPIDS)
94 #define kMaxNumberPMTStreams 32
95
96
97 struct hb_stream_s
98 {
99     int     frames;             /* video frames so far */
100     int     errors;             /* total errors so far */
101     int     last_error_frame;   /* frame # at last error message */
102     int     last_error_count;   /* # errors at last error message */
103     int     packetsize;         /* Transport Stream packet size */
104
105     uint8_t need_keyframe;      // non-zero if want to start at a keyframe
106     uint8_t ts_found_pcr;       // non-zero if we've found at least one input pcr
107     int     ts_pcr_out;         // sequence number of most recent output pcr
108     int     ts_pcr_in;          // sequence number of most recent input pcr
109     int64_t ts_pcr;             // most recent input pcr
110     int64_t ts_pcrhist[4];      // circular buffer of output pcrs
111
112     uint8_t *ts_packet;         /* buffer for one TS packet */
113     hb_buffer_t *ts_buf[kMaxNumberDecodeStreams];
114     int     ts_pos[kMaxNumberDecodeStreams];
115     int8_t  ts_skipbad[kMaxNumberDecodeStreams];
116     int8_t  ts_streamcont[kMaxNumberDecodeStreams];
117     uint8_t ts_pkt_summary[kMaxNumberDecodeStreams][8];
118
119     hb_buffer_t *fwrite_buf;      /* PS buffer (set by hb_ts_stream_decode) */
120
121     int      chapter;           /* Chapter that we are currently in */
122     int64_t  chapter_end;       /* HB time that the current chapter ends */
123
124     /*
125      * Stuff before this point is dynamic state updated as we read the
126      * stream. Stuff after this point is stream description state that
127      * we learn during the initial scan but cache so it can be
128      * reused during the conversion read.
129      */
130     uint8_t ts_number_video_pids;
131     uint8_t ts_number_audio_pids;
132     uint8_t ts_flags;           // stream characteristics:
133 #define         TS_HAS_PCR  (1 << 0)    // at least one PCR seen
134 #define         TS_HAS_RAP  (1 << 1)    // Random Access Point bit seen
135 #define         TS_HAS_RSEI (1 << 2)    // "Restart point" SEI seen
136     uint8_t ts_IDRs;            // # IDRs found during duration scan
137
138     int16_t ts_video_pids[kMaxNumberVideoPIDS];
139     int16_t ts_audio_pids[kMaxNumberAudioPIDS];
140
141     uint32_t ts_format_id[kMaxNumberDecodeStreams];
142 #define TS_FORMAT_ID_AC3 (('A' << 24) | ('C' << 16) | ('-' << 8) | '3')
143     uint8_t ts_stream_type[kMaxNumberDecodeStreams];
144     uint8_t ts_multiplexed[kMaxNumberDecodeStreams];
145
146     char    *path;
147     FILE    *file_handle;
148     hb_stream_type_t hb_stream_type;
149     hb_title_t *title;
150
151     AVFormatContext *ffmpeg_ic;
152     AVPacket *ffmpeg_pkt;
153     double ffmpeg_tsconv[MAX_STREAMS];
154     uint8_t ffmpeg_video_id;
155
156     struct {
157         int lang_code;
158         int flags;
159         int rate;
160         int bitrate;
161     } a52_info[kMaxNumberAudioPIDS];
162
163     struct
164     {
165         unsigned short program_number;
166         unsigned short program_map_PID;
167     } pat_info[kMaxNumberPMTStreams];
168     int     ts_number_pat_entries;
169
170     struct
171     {
172         int reading;
173         unsigned char *tablebuf;
174         unsigned int tablepos;
175         unsigned char current_continuity_counter;
176
177         int section_length;
178         int program_number;
179         unsigned int PCR_PID;
180         int program_info_length;
181         unsigned char *progam_info_descriptor_data;
182         struct
183         {
184             unsigned char stream_type;
185             unsigned short elementary_PID;
186             unsigned short ES_info_length;
187             unsigned char *es_info_descriptor_data;
188         } pmt_stream_info[kMaxNumberPMTStreams];
189     } pmt_info;
190 };
191
192 /***********************************************************************
193  * Local prototypes
194  **********************************************************************/
195 static void hb_stream_duration(hb_stream_t *stream, hb_title_t *inTitle);
196 static void hb_ts_stream_init(hb_stream_t *stream);
197 static void hb_ts_stream_find_pids(hb_stream_t *stream);
198 static int hb_ts_stream_decode(hb_stream_t *stream, hb_buffer_t *obuf);
199 static void hb_ts_stream_reset(hb_stream_t *stream);
200 static hb_audio_t *hb_ts_stream_set_audio_id_and_codec(hb_stream_t *stream,
201                                                        int aud_pid_index);
202 static void hb_ps_stream_find_audio_ids(hb_stream_t *stream, hb_title_t *title);
203 static off_t align_to_next_packet(hb_stream_t *stream);
204
205 static int ffmpeg_open( hb_stream_t *stream, hb_title_t *title );
206 static void ffmpeg_close( hb_stream_t *d );
207 static hb_title_t *ffmpeg_title_scan( hb_stream_t *stream );
208 static int ffmpeg_read( hb_stream_t *stream, hb_buffer_t *buf );
209 static int ffmpeg_seek( hb_stream_t *stream, float frac );
210
211 /*
212  * streams have a bunch of state that's learned during the scan. We don't
213  * want to throw away the state when scan does a close then relearn
214  * everything when reader does an open. So we save the stream state on
215  * the close following a scan and reuse it when 'reader' does an open.
216  */
217 static hb_list_t *stream_state_list;
218
219 static hb_stream_t *hb_stream_lookup( const char *path )
220 {
221     if ( stream_state_list == NULL )
222         return NULL;
223
224     hb_stream_t *ss;
225     int i = 0;
226
227     while ( ( ss = hb_list_item( stream_state_list, i++ ) ) != NULL )
228     {
229         if ( strcmp( path, ss->path ) == 0 )
230         {
231             break;
232         }
233     }
234     return ss;
235 }
236
237 static void hb_stream_state_delete( hb_stream_t *ss )
238 {
239     hb_list_rem( stream_state_list, ss );
240     free( ss->path );
241     free( ss );
242 }
243
244 /*
245  * logging routines.
246  * these frontend hb_log because transport streams can have a lot of errors
247  * so we want to rate limit messages. this routine limits the number of
248  * messages to at most one per minute of video. other errors that occur
249  * during the minute are counted & the count is output with the next
250  * error msg we print.
251  */
252 static void ts_warn_helper( hb_stream_t *stream, char *log, va_list args )
253 {
254     // limit error printing to at most one per minute of video (at 30fps)
255     ++stream->errors;
256     if ( stream->frames - stream->last_error_frame >= 30*60 )
257     {
258         char msg[256];
259
260         vsnprintf( msg, sizeof(msg), log, args );
261
262         if ( stream->errors - stream->last_error_count < 10 )
263         {
264             hb_log( "stream: error near frame %d: %s", stream->frames, msg );
265         }
266         else
267         {
268             int Edelta = stream->errors - stream->last_error_count;
269             double Epcnt = (double)Edelta * 100. /
270                             (stream->frames - stream->last_error_frame);
271             hb_log( "stream: %d new errors (%.0f%%) up to frame %d: %s",
272                     Edelta, Epcnt, stream->frames, msg );
273         }
274         stream->last_error_frame = stream->frames;
275         stream->last_error_count = stream->errors;
276     }
277 }
278
279 static void ts_warn( hb_stream_t*, char*, ... ) HB_WPRINTF(2,3);
280 static void ts_err( hb_stream_t*, int, char*, ... ) HB_WPRINTF(3,4);
281
282 static void ts_warn( hb_stream_t *stream, char *log, ... )
283 {
284     va_list args;
285     va_start( args, log );
286     ts_warn_helper( stream, log, args );
287     va_end( args );
288 }
289
290 static void ts_err( hb_stream_t *stream, int curstream, char *log, ... )
291 {
292     va_list args;
293     va_start( args, log );
294     ts_warn_helper( stream, log, args );
295     va_end( args );
296
297     stream->ts_skipbad[curstream] = 1;
298     stream->ts_pos[curstream] = 0;
299     stream->ts_streamcont[curstream] = -1;
300 }
301
302 static int check_ps_sync(const uint8_t *buf)
303 {
304     // a legal MPEG program stream must start with a Pack header in the
305     // first four bytes.
306     return (buf[0] == 0x00) && (buf[1] == 0x00) &&
307            (buf[2] == 0x01) && (buf[3] == 0xba);
308 }
309
310 static int check_ps_sc(const uint8_t *buf)
311 {
312     // a legal MPEG program stream must start with a Pack followed by a
313     // some other start code. If we've already verified the pack, this skip
314     // it and checks for a start code prefix.
315     int pos = 14 + ( buf[13] & 0x7 );   // skip over the PACK
316     return (buf[pos+0] == 0x00) && (buf[pos+1] == 0x00) && (buf[pos+2] == 0x01);
317 }
318
319 static int check_ts_sync(const uint8_t *buf)
320 {
321     // must have initial sync byte, no scrambling & a legal adaptation ctrl
322     return (buf[0] == 0x47) && ((buf[3] >> 6) == 0) && ((buf[3] >> 4) > 0);
323 }
324
325 static int have_ts_sync(const uint8_t *buf, int psize)
326 {
327     return check_ts_sync(&buf[0*psize]) && check_ts_sync(&buf[1*psize]) &&
328            check_ts_sync(&buf[2*psize]) && check_ts_sync(&buf[3*psize]) &&
329            check_ts_sync(&buf[4*psize]) && check_ts_sync(&buf[5*psize]) &&
330            check_ts_sync(&buf[6*psize]) && check_ts_sync(&buf[7*psize]);
331 }
332
333 static int hb_stream_check_for_ts(const uint8_t *buf)
334 {
335     // transport streams should have a sync byte every 188 bytes.
336     // search the first 8KB of buf looking for at least 8 consecutive
337     // correctly located sync patterns.
338     int offset = 0;
339
340     for ( offset = 0; offset < 8*1024-8*188; ++offset )
341     {
342         if ( have_ts_sync( &buf[offset], 188) )
343             return 188 | (offset << 8);
344         if ( have_ts_sync( &buf[offset], 192) )
345             return 192 | (offset << 8);
346         if ( have_ts_sync( &buf[offset], 204) )
347             return 204 | (offset << 8);
348         if ( have_ts_sync( &buf[offset], 208) )
349             return 208 | (offset << 8);
350     }
351     return 0;
352 }
353
354 static int hb_stream_check_for_ps(const uint8_t *buf)
355 {
356     // program streams should start with a PACK then some other mpeg start
357     // code (usually a SYS but that might be missing if we only have a clip).
358     return check_ps_sync(buf) && check_ps_sc(buf);
359 }
360
361 static int hb_stream_check_for_dvd_ps(const uint8_t *buf)
362 {
363     // DVD program streams should have a Pack header every 2048 bytes.
364     // check that we have 4 of these in a row.
365     return check_ps_sync(&buf[0*2048]) && check_ps_sync(&buf[1*2048]) &&
366            check_ps_sync(&buf[2*2048]) && check_ps_sync(&buf[3*2048]);
367 }
368
369 static int hb_stream_get_type(hb_stream_t *stream)
370 {
371     uint8_t buf[2048*4];
372
373     if ( fread(buf, 1, sizeof(buf), stream->file_handle) == sizeof(buf) )
374     {
375         int psize;
376         if ( ( psize = hb_stream_check_for_ts(buf) ) != 0 )
377         {
378             int offset = psize >> 8;
379             psize &= 0xff;
380             hb_log("file is MPEG Transport Stream with %d byte packets"
381                    " offset %d bytes", psize, offset);
382             stream->packetsize = psize;
383             stream->hb_stream_type = transport;
384             hb_ts_stream_init(stream);
385             if ( !stream->ts_number_video_pids || !stream->ts_number_audio_pids )
386             {
387                 return 0;
388             }
389             return 1;
390         }
391         if ( hb_stream_check_for_dvd_ps(buf) != 0 )
392         {
393             hb_log("file is MPEG DVD Program Stream");
394             stream->hb_stream_type = dvd_program;
395             return 1;
396         }
397         if ( hb_stream_check_for_ps(buf) != 0 )
398         {
399             hb_log("file is MPEG Program Stream");
400             stream->hb_stream_type = program;
401             return 1;
402         }
403     }
404     return 0;
405 }
406
407 static void hb_stream_delete_dynamic( hb_stream_t *d )
408 {
409     if( d->file_handle )
410     {
411         fclose( d->file_handle );
412                 d->file_handle = NULL;
413     }
414
415         int i=0;
416
417     if ( d->ts_packet )
418     {
419         free( d->ts_packet );
420         d->ts_packet = NULL;
421     }
422         for (i = 0; i < kMaxNumberDecodeStreams; i++)
423         {
424                 if (d->ts_buf[i])
425                 {
426                         hb_buffer_close(&(d->ts_buf[i]));
427                         d->ts_buf[i] = NULL;
428                 }
429         }
430 }
431
432 static void hb_stream_delete( hb_stream_t *d )
433 {
434     hb_stream_delete_dynamic( d );
435     free( d->path );
436     free( d );
437 }
438
439 static int audio_inactive( hb_stream_t *stream, int indx )
440 {
441     int aud_indx = indx - 1;
442
443     if ( stream->ts_audio_pids[aud_indx] < 0 )
444     {
445         // PID declared inactive by hb_stream_title_scan
446         return 1;
447     }
448     if ( stream->ts_audio_pids[aud_indx] == stream->pmt_info.PCR_PID )
449     {
450         // PCR PID is always active
451         return 0;
452     }
453
454     // see if we should make the stream inactive because scan.c didn't
455     // find a valid audio bitstream.
456     int i;
457     for ( i = 0; i < hb_list_count( stream->title->list_audio ); ++i )
458     {
459         hb_audio_t *audio = hb_list_item( stream->title->list_audio, i );
460         if ( audio->id == indx )
461         {
462             return 0;
463         }
464     }
465     // not in the title's audio list - declare the PID inactive
466     stream->ts_audio_pids[aud_indx] = -stream->ts_audio_pids[aud_indx];
467     return 1;
468 }
469
470 /***********************************************************************
471  * hb_stream_open
472  ***********************************************************************
473  *
474  **********************************************************************/
475 hb_stream_t * hb_stream_open( char *path, hb_title_t *title )
476 {
477     FILE *f = fopen( path, "rb" );
478     if ( f == NULL )
479     {
480         hb_log( "hb_stream_open: open %s failed", path );
481         return NULL;
482     }
483
484     hb_stream_t *d = calloc( sizeof( hb_stream_t ), 1 );
485     if ( d == NULL )
486     {
487         fclose( f );
488         hb_log( "hb_stream_open: can't allocate space for %s stream state", path );
489         return NULL;
490     }
491
492     /*
493      * if we're opening the stream to read & convert, we need
494      * the state we saved when we scanned the stream. if we're
495      * opening the stream to scan it we want to rebuild the state
496      * (even if we have saved state, the stream may have changed).
497      */
498     hb_stream_t *ss = hb_stream_lookup( path );
499     if ( title && ss && ss->hb_stream_type != ffmpeg )
500     {
501         /*
502          * copy the saved state since we might be encoding the same stream
503          * multiple times.
504          */
505         memcpy( d, ss, sizeof(*d) );
506         d->file_handle = f;
507         d->title = title;
508         d->path = strdup( path );
509
510         if ( d->hb_stream_type == transport )
511         {
512             d->ts_packet = malloc( d->packetsize );
513
514             int i = 0;
515             for ( ; i < d->ts_number_video_pids + d->ts_number_audio_pids; i++)
516             {
517                 if ( i && audio_inactive( d, i ) )
518                 {
519                     // this PID isn't wanted (we don't have a codec for it
520                     // or scan didn't find audio parameters)
521                     continue;
522                 }
523                 d->ts_buf[i] = hb_buffer_init(d->packetsize);
524                                 d->ts_buf[i]->size = 0;
525             }
526             hb_stream_seek( d, 0. );
527         }
528         return d;
529     }
530
531     /*
532      * opening for scan - delete any saved state then (re)scan the stream.
533      * If it's something we can deal with (MPEG2 PS or TS) return a stream
534      * reference structure & null otherwise.
535      */
536     if ( ss != NULL )
537     {
538         hb_stream_state_delete( ss );
539     }
540     d->file_handle = f;
541     d->title = title;
542     d->path = strdup( path );
543     if (d->path != NULL )
544     {
545         if ( hb_stream_get_type( d ) != 0 )
546         {
547             return d;
548         }
549         fclose( d->file_handle );
550                 d->file_handle = NULL;
551         if ( ffmpeg_open( d, title ) )
552         {
553             return d;
554         }
555     }
556     if ( d->file_handle )
557     {
558         fclose( d->file_handle );
559     }
560     if (d->path)
561     {
562         free( d->path );
563     }
564     hb_log( "hb_stream_open: open %s failed", path );
565     free( d );
566     return NULL;
567 }
568
569 /***********************************************************************
570  * hb_stream_close
571  ***********************************************************************
572  * Closes and frees everything
573  **********************************************************************/
574 void hb_stream_close( hb_stream_t ** _d )
575 {
576     hb_stream_t *stream = * _d;
577
578     if ( stream->hb_stream_type == ffmpeg )
579     {
580         ffmpeg_close( stream );
581         hb_stream_delete( stream );
582         *_d = NULL;
583         return;
584     }
585
586     if ( stream->frames )
587     {
588         hb_log( "stream: %d good frames, %d errors (%.0f%%)", stream->frames,
589                 stream->errors, (double)stream->errors * 100. /
590                 (double)stream->frames );
591     }
592
593     /*
594      * if the stream was opened for a scan, cache the result, otherwise delete
595      * the state.
596      */
597     if ( stream->title == NULL )
598     {
599         hb_stream_delete_dynamic( stream );
600         if ( stream_state_list == NULL )
601         {
602             stream_state_list = hb_list_init();
603         }
604         hb_list_add( stream_state_list, stream );
605     }
606     else
607     {
608         hb_stream_delete( stream );
609     }
610     *_d = NULL;
611 }
612
613 /* when the file was first opened we made entries for all the audio elementary
614  * streams we found in it. Streams that were later found during the preview scan
615  * now have an audio codec, type, rate, etc., associated with them. At the end
616  * of the scan we delete all the audio entries that weren't found by the scan
617  * or don't have a format we support. This routine deletes audio entry 'indx'
618  * by setting its PID to an invalid value so no packet will match it. (We can't
619  * move any of the entries since the index of the entry is used as the id
620  * of the media stream for HB. */
621 static void hb_stream_delete_audio_entry(hb_stream_t *stream, int indx)
622 {
623     if ( stream->ts_audio_pids[indx] > 0 )
624     {
625         stream->ts_audio_pids[indx] = -stream->ts_audio_pids[indx];
626     }
627 }
628
629 static int index_of_pid(int pid, hb_stream_t *stream)
630 {
631     int i;
632
633     if ( pid == stream->ts_video_pids[0] )
634         return 0;
635
636     for ( i = 0; i < stream->ts_number_audio_pids; ++i )
637         if ( pid == stream->ts_audio_pids[i] )
638             return i + 1;
639
640     return -1;
641 }
642
643 /***********************************************************************
644  * hb_ps_stream_title_scan
645  ***********************************************************************
646  *
647  **********************************************************************/
648 hb_title_t * hb_stream_title_scan(hb_stream_t *stream)
649 {
650         if ( stream->hb_stream_type == ffmpeg )
651         return ffmpeg_title_scan( stream );
652
653     // 'Barebones Title'
654     hb_title_t *aTitle = hb_title_init( stream->path, 0 );
655     aTitle->index = 1;
656
657         // Copy part of the stream path to the title name
658         char *sep = strrchr(stream->path, '/');
659         if (sep)
660                 strcpy(aTitle->name, sep+1);
661         char *dot_term = strrchr(aTitle->name, '.');
662         if (dot_term)
663                 *dot_term = '\0';
664
665     // Height, width,  rate and aspect ratio information is filled in when the previews are built
666
667     hb_stream_duration(stream, aTitle);
668
669     // One Chapter
670     hb_chapter_t * chapter;
671     chapter = calloc( sizeof( hb_chapter_t ), 1 );
672     chapter->index = 1;
673     chapter->duration = aTitle->duration;
674     chapter->hours = aTitle->hours;
675     chapter->minutes = aTitle->minutes;
676     chapter->seconds = aTitle->seconds;
677     hb_list_add( aTitle->list_chapter, chapter );
678
679     // Figure out how many audio streams we really have:
680     // - For transport streams, for each PID listed in the PMT (whether
681     //   or not it was an audio stream type) read the bitstream until we
682     //   find an packet from that PID containing a PES header and see if
683     //   the elementary stream is an audio type.
684     // - For program streams read the first 4MB and take every unique
685     //   audio stream we find.
686         if (stream->hb_stream_type == transport)
687         {
688         int i;
689
690         for (i=0; i < stream->ts_number_audio_pids; i++)
691         {
692             hb_audio_t *audio = hb_ts_stream_set_audio_id_and_codec(stream, i);
693             if (audio->config.in.codec)
694                 hb_list_add( aTitle->list_audio, audio );
695             else
696             {
697                 free(audio);
698                 hb_stream_delete_audio_entry(stream, i);
699             }
700         }
701
702         // make sure we're grabbing the PCR PID
703         if ( index_of_pid( stream->pmt_info.PCR_PID, stream ) < 0 )
704         {
705             stream->ts_audio_pids[stream->ts_number_audio_pids++] =
706                 stream->pmt_info.PCR_PID;
707         }
708
709         // set the video id, codec & muxer
710         aTitle->video_id = 0;
711         aTitle->video_codec = st2codec[stream->ts_stream_type[0]].codec;
712         aTitle->video_codec_param = st2codec[stream->ts_stream_type[0]].codec_param;
713         aTitle->demuxer = HB_MPEG2_TS_DEMUXER;
714
715         if ( ( stream->ts_flags & TS_HAS_PCR ) == 0 )
716         {
717             hb_log( "transport stream missing PCRs - using video DTS instead" );
718         }
719
720         if ( stream->ts_IDRs < 1 )
721         {
722             hb_log( "transport stream doesn't seem to have video IDR frames" );
723             aTitle->flags |= HBTF_NO_IDR;
724         }
725         }
726     else
727     {
728         hb_ps_stream_find_audio_ids(stream, aTitle);
729     }
730
731   return aTitle;
732 }
733
734 /*
735  * read the next transport stream packet from 'stream'. Return NULL if
736  * we hit eof & a pointer to the sync byte otherwise.
737  */
738 static const uint8_t *next_packet( hb_stream_t *stream )
739 {
740     uint8_t *buf = stream->ts_packet + stream->packetsize - 188;
741
742     while ( 1 )
743     {
744         if ( fread(stream->ts_packet, 1, stream->packetsize, stream->file_handle) !=
745              stream->packetsize )
746         {
747             return NULL;
748         }
749         if (buf[0] == 0x47)
750         {
751             return buf;
752         }
753         // lost sync - back up to where we started then try to re-establish.
754         off_t pos = ftello(stream->file_handle) - stream->packetsize;
755         off_t pos2 = align_to_next_packet(stream);
756         if ( pos2 == 0 )
757         {
758             hb_log( "next_packet: eof while re-establishing sync @ %"PRId64, pos );
759             return NULL;
760         }
761         ts_warn( stream, "next_packet: sync lost @ %"PRId64", regained after %"PRId64" bytes",
762                  pos, pos2 );
763     }
764 }
765
766 /*
767  * skip to the start of the next PACK header in program stream src_stream.
768  */
769 static void skip_to_next_pack( hb_stream_t *src_stream )
770 {
771     // scan forward until we find the start of the next pack
772     uint32_t strt_code = -1;
773     int c;
774
775     flockfile( src_stream->file_handle );
776     while ( ( c = getc_unlocked( src_stream->file_handle ) ) != EOF )
777     {
778         strt_code = ( strt_code << 8 ) | c;
779         if ( strt_code == 0x000001ba )
780             // we found the start of the next pack
781             break;
782     }
783     funlockfile( src_stream->file_handle );
784
785     // if we didn't terminate on an eof back up so the next read
786     // starts on the pack boundary.
787     if ( c != EOF )
788     {
789         fseeko( src_stream->file_handle, -4, SEEK_CUR );
790     }
791 }
792
793 static int isIframe( hb_stream_t *stream, const uint8_t *buf, int adapt_len )
794 {
795     // For mpeg2: look for a gop start or i-frame picture start
796     // for h.264: look for idr nal type or a slice header for an i-frame
797     // for vc1:   look for a Sequence header
798     int i;
799     uint32_t strid = 0;
800
801
802     if ( stream->ts_stream_type[0] <= 2 )
803     {
804         // This section of the code handles MPEG-1 and MPEG-2 video streams
805         for (i = 13 + adapt_len; i < 188; i++)
806         {
807             strid = (strid << 8) | buf[i];
808             if ( ( strid >> 8 ) == 1 )
809             {
810                 // we found a start code
811                 uint8_t id = strid;
812                 switch ( id )
813                 {
814                     case 0xB8: // group_start_code (GOP header)
815                     case 0xB3: // sequence_header code
816                         return 1;
817
818                     case 0x00: // picture_start_code
819                         // picture_header, let's see if it's an I-frame
820                         if (i<185)
821                         {
822                             // check if picture_coding_type == 1
823                             if ((buf[i+2] & (0x7 << 3)) == (1 << 3))
824                             {
825                                 // found an I-frame picture
826                                 return 1;
827                             }
828                         }
829                         break;
830                 }
831             }
832         }
833         // didn't find an I-frame
834         return 0;
835     }
836     if ( stream->ts_stream_type[0] == 0x1b )
837     {
838         // we have an h.264 stream 
839         for (i = 13 + adapt_len; i < 188; i++)
840         {
841             strid = (strid << 8) | buf[i];
842             if ( ( strid >> 8 ) == 1 )
843             {
844                 // we found a start code - remove the ref_idc from the nal type
845                 uint8_t nal_type = strid & 0x1f;
846                 if ( nal_type == 0x05 )
847                     // h.264 IDR picture start
848                     return 1;
849             }
850         }
851         // didn't find an I-frame
852         return 0;
853     }
854     if ( stream->ts_stream_type[0] == 0xea )
855     {
856         // we have an vc1 stream 
857         for (i = 13 + adapt_len; i < 188; i++)
858         {
859             strid = (strid << 8) | buf[i];
860             if ( strid == 0x10f )
861             {
862                 // the ffmpeg vc1 decoder requires a seq hdr code in the first
863                 // frame.
864                 return 1;
865             }
866         }
867         // didn't find an I-frame
868         return 0;
869     }
870
871     // we don't understand the stream type so just say "yes" otherwise
872     // we'll discard all the video.
873     return 1;
874 }
875
876 /*
877  * scan the next MB of 'stream' to find the next start packet for
878  * the Packetized Elementary Stream associated with TS PID 'pid'.
879  */
880 static const uint8_t *hb_ts_stream_getPEStype(hb_stream_t *stream, uint32_t pid)
881 {
882     int npack = 300000; // max packets to read
883
884     while (--npack >= 0)
885     {
886         const uint8_t *buf = next_packet( stream );
887         if ( buf == NULL )
888         {
889             hb_log("hb_ts_stream_getPEStype: EOF while searching for PID 0x%x", pid);
890             return 0;
891         }
892
893         // while we're reading the stream, check if it has valid PCRs
894         // and/or random access points.
895         uint32_t pack_pid = ( (buf[1] & 0x1f) << 8 ) | buf[2];
896         if ( pack_pid == stream->pmt_info.PCR_PID )
897         {
898             if ( ( buf[5] & 0x10 ) &&
899                  ( ( ( buf[3] & 0x30 ) == 0x20 ) ||
900                    ( ( buf[3] & 0x30 ) == 0x30 && buf[4] > 6 ) ) )
901             {
902                 stream->ts_flags |= TS_HAS_PCR;
903             }
904         }
905         if ( buf[5] & 0x40 )
906         {
907             stream->ts_flags |= TS_HAS_RAP;
908         }
909
910         /*
911          * The PES header is only in TS packets with 'start' set so we check
912          * that first then check for the right PID.
913          */
914         if ((buf[1] & 0x40) == 0 || pack_pid != pid )
915         {
916             // not a start packet or not the pid we want
917             continue;
918         }
919
920         /* skip over the TS hdr to return a pointer to the PES hdr */
921         int udata = 4;
922         switch (buf[3] & 0x30)
923         {
924             case 0x00: // illegal
925             case 0x20: // fill packet
926                 continue;
927
928             case 0x30: // adaptation
929                 if (buf[4] > 182)
930                 {
931                     hb_log("hb_ts_stream_getPEStype: invalid adaptation field length %d for PID 0x%x", buf[4], pid);
932                     continue;
933                 }
934                 udata += buf[4] + 1;
935                 break;
936         }
937         /* PES hdr has to begin with an mpeg start code */
938         if (buf[udata+0] == 0x00 && buf[udata+1] == 0x00 && buf[udata+2] == 0x01)
939         {
940             return &buf[udata];
941         }
942     }
943
944     /* didn't find it */
945     return 0;
946 }
947
948 static uint64_t hb_ps_stream_getVideoPTS(hb_stream_t *stream)
949 {
950     hb_buffer_t *buf  = hb_buffer_init(HB_DVD_READ_BUFFER_SIZE);
951     hb_list_t *list = hb_list_init();
952     // how many blocks we read while searching for a video PES header
953     int blksleft = 1024;
954     uint64_t pts = 0;
955
956     while (--blksleft >= 0 && hb_stream_read(stream, buf) == 1)
957     {
958         hb_buffer_t *es;
959
960         // 'buf' contains an MPEG2 PACK - get a list of all it's elementary streams
961         hb_demux_ps( buf, list, 0 );
962
963         while ( ( es = hb_list_item( list, 0 ) ) )
964         {
965             hb_list_rem( list, es );
966             if ( es->id == 0xe0 )
967             {
968                 // this PES contains video - if there's a PTS we're done
969                 // hb_demux_ps left the PTS in buf_es->start.
970                 if ( es->start != ~0 )
971                 {
972                     pts = es->start;
973                     blksleft = 0;
974                     break;
975                 }
976             }
977             hb_buffer_close( &es );
978         }
979     }
980     hb_list_empty( &list );
981     hb_buffer_close(&buf);
982     return pts;
983 }
984
985 /***********************************************************************
986  * hb_stream_duration
987  ***********************************************************************
988  *
989  * Finding stream duration is difficult.  One issue is that the video file
990  * may have chunks from several different program fragments (main feature,
991  * commercials, station id, trailers, etc.) all with their own base pts
992  * value.  We can't find the piece boundaries without reading the entire
993  * file but if we compute a rate based on time stamps from two different
994  * pieces the result will be meaningless.  The second issue is that the
995  * data rate of compressed video normally varies by 5-10x over the length
996  * of the video. This says that we want to compute the rate over relatively
997  * long segments to get a representative average but long segments increase
998  * the likelihood that we'll cross a piece boundary.
999  *
1000  * What we do is take time stamp samples at several places in the file
1001  * (currently 16) then compute the average rate (i.e., ticks of video per
1002  * byte of the file) for all pairs of samples (N^2 rates computed for N
1003  * samples). Some of those rates will be absurd because the samples came
1004  * from different segments. Some will be way low or high because the
1005  * samples came from a low or high motion part of the segment. But given
1006  * that we're comparing *all* pairs the majority of the computed rates
1007  * should be near the overall average.  So we median filter the computed
1008  * rates to pick the most representative value.
1009  *
1010  **********************************************************************/
1011 struct pts_pos {
1012     uint64_t pos;   /* file position of this PTS sample */
1013     uint64_t pts;   /* PTS from video stream */
1014 };
1015
1016 #define NDURSAMPLES 128
1017
1018 // get one (position, timestamp) sampple from a transport or program
1019 // stream.
1020 static struct pts_pos hb_sample_pts(hb_stream_t *stream, uint64_t fpos)
1021 {
1022     struct pts_pos pp = { 0, 0 };
1023
1024     if ( stream->hb_stream_type == transport )
1025     {
1026         const uint8_t *buf;
1027         fseeko( stream->file_handle, fpos, SEEK_SET );
1028         align_to_next_packet( stream );
1029         buf = hb_ts_stream_getPEStype( stream, stream->ts_video_pids[0] );
1030         if ( buf == NULL )
1031         {
1032             hb_log("hb_sample_pts: couldn't find video packet near %"PRIu64, fpos);
1033             return pp;
1034         }
1035         if ( ( buf[7] >> 7 ) != 1 )
1036         {
1037             hb_log("hb_sample_pts: no PTS in video packet near %"PRIu64, fpos);
1038             return pp;
1039         }
1040         pp.pts = ( ( (uint64_t)buf[9] >> 1 ) & 7 << 30 ) |
1041                  ( (uint64_t)buf[10] << 22 ) |
1042                  ( ( (uint64_t)buf[11] >> 1 ) << 15 ) |
1043                  ( (uint64_t)buf[12] << 7 ) |
1044                  ( (uint64_t)buf[13] >> 1 );
1045
1046         if ( isIframe( stream, buf, -4 ) )
1047         {
1048             if (  stream->ts_IDRs < 255 )
1049             {
1050                 ++stream->ts_IDRs;
1051             }
1052         }
1053     }
1054     else
1055     {
1056         // round address down to nearest dvd sector start
1057         fpos &=~ ( HB_DVD_READ_BUFFER_SIZE - 1 );
1058         fseeko( stream->file_handle, fpos, SEEK_SET );
1059         if ( stream->hb_stream_type == program )
1060         {
1061             skip_to_next_pack( stream );
1062         }
1063         pp.pts = hb_ps_stream_getVideoPTS( stream );
1064     }
1065     pp.pos = ftello(stream->file_handle);
1066     return pp;
1067 }
1068
1069 static int dur_compare( const void *a, const void *b )
1070 {
1071     const double *aval = a, *bval = b;
1072     return ( *aval < *bval ? -1 : ( *aval == *bval ? 0 : 1 ) );
1073 }
1074
1075 // given an array of (position, time) samples, compute a max-likelihood
1076 // estimate of the average rate by computing the rate between all pairs
1077 // of samples then taking the median of those rates.
1078 static double compute_stream_rate( struct pts_pos *pp, int n )
1079 {
1080     int i, j;
1081     double rates[NDURSAMPLES * NDURSAMPLES / 8];
1082     double *rp = rates;
1083
1084     // the following nested loops compute the rates between all pairs.
1085     *rp = 0;
1086     for ( i = 0; i < n-1; ++i )
1087     {
1088         // Bias the median filter by not including pairs that are "far"
1089         // from one another. This is to handle cases where the file is
1090         // made of roughly equal size pieces where a symmetric choice of
1091         // pairs results in having the same number of intra-piece &
1092         // inter-piece rate estimates. This would mean that the median
1093         // could easily fall in the inter-piece part of the data which
1094         // would give a bogus estimate. The 'ns' index creates an
1095         // asymmetry that favors locality.
1096         int ns = i + ( n >> 3 );
1097         if ( ns > n )
1098             ns = n;
1099         for ( j = i+1; j < ns; ++j )
1100         {
1101             if ( (uint64_t)(pp[j].pts - pp[i].pts) > 90000LL*3600*6 )
1102                 break;
1103             if ( pp[j].pts != pp[i].pts && pp[j].pos > pp[i].pos )
1104             {
1105                 *rp = ((double)( pp[j].pts - pp[i].pts )) /
1106                       ((double)( pp[j].pos - pp[i].pos ));
1107                                 ++rp;
1108             }
1109         }
1110     }
1111     // now compute and return the median of all the (n*n/2) rates we computed
1112     // above.
1113     int nrates = rp - rates;
1114     qsort( rates, nrates, sizeof (rates[0] ), dur_compare );
1115     return rates[nrates >> 1];
1116 }
1117
1118 static void hb_stream_duration(hb_stream_t *stream, hb_title_t *inTitle)
1119 {
1120     struct pts_pos ptspos[NDURSAMPLES];
1121     struct pts_pos *pp = ptspos;
1122     int i;
1123
1124     fseeko(stream->file_handle, 0, SEEK_END);
1125     uint64_t fsize = ftello(stream->file_handle);
1126     uint64_t fincr = fsize / NDURSAMPLES;
1127     uint64_t fpos = fincr / 2;
1128     for ( i = NDURSAMPLES; --i >= 0; fpos += fincr )
1129     {
1130         *pp++ = hb_sample_pts(stream, fpos);
1131     }
1132     uint64_t dur = compute_stream_rate( ptspos, pp - ptspos ) * (double)fsize;
1133     inTitle->duration = dur;
1134     dur /= 90000;
1135     inTitle->hours    = dur / 3600;
1136     inTitle->minutes  = ( dur % 3600 ) / 60;
1137     inTitle->seconds  = dur % 60;
1138
1139     rewind(stream->file_handle);
1140 }
1141
1142 /***********************************************************************
1143  * hb_stream_read
1144  ***********************************************************************
1145  *
1146  **********************************************************************/
1147 int hb_stream_read( hb_stream_t * src_stream, hb_buffer_t * b )
1148 {
1149         if ( src_stream->hb_stream_type == ffmpeg )
1150     {
1151         return ffmpeg_read( src_stream, b );
1152     }
1153     if ( src_stream->hb_stream_type == dvd_program )
1154     {
1155         size_t amt_read = fread(b->data, HB_DVD_READ_BUFFER_SIZE, 1,
1156                                 src_stream->file_handle);
1157         return (amt_read > 0);
1158     }
1159     if ( src_stream->hb_stream_type == program )
1160     {
1161         // a general program stream has arbitrary sized pack's. we're
1162         // currently positioned at the start of a pack so read up to but
1163         // not including the start of the next, expanding the buffer
1164         // as necessary.
1165         uint8_t *cp = b->data;
1166         uint8_t *ep = cp + b->alloc;
1167         uint32_t strt_code = -1;
1168         int c;
1169
1170         // consume the first byte of the initial pack so we don't match on
1171         // it in the loop below.
1172         if ( ( c = getc( src_stream->file_handle ) ) == EOF )
1173             return 0;
1174
1175         *cp++ = c;
1176
1177         flockfile( src_stream->file_handle );
1178         while ( ( c = getc_unlocked( src_stream->file_handle ) ) != EOF )
1179         {
1180             strt_code = ( strt_code << 8 ) | c;
1181             if ( strt_code == 0x000001ba )
1182                 // we found the start of the next pack
1183                 break;
1184             if ( cp >= ep )
1185             {
1186                 // need to expand the buffer
1187                 int curSize = cp - b->data;
1188                 hb_buffer_realloc( b, curSize * 2 );
1189                 cp = b->data + curSize;
1190                 ep = b->data + b->alloc;
1191             }
1192             *cp++ = c;
1193         }
1194         funlockfile( src_stream->file_handle );
1195
1196         // if we didn't terminate on an eof back up so the next read
1197         // starts on the pack boundary.
1198         b->size = cp - b->data;
1199         if ( c != EOF )
1200         {
1201             fseeko( src_stream->file_handle, -4, SEEK_CUR );
1202             b->size -= 4;
1203         }
1204         return 1;
1205     }
1206     return hb_ts_stream_decode( src_stream, b );
1207 }
1208
1209 int hb_stream_seek_chapter( hb_stream_t * stream, int chapter_num )
1210 {
1211
1212     if ( stream->hb_stream_type != ffmpeg )
1213     {
1214         // currently meaningliess for transport and program streams
1215         return 1;
1216     }
1217     if ( !stream || !stream->title ||
1218          chapter_num > hb_list_count( stream->title->list_chapter ) )
1219     {
1220         return 0;
1221     }
1222
1223     int64_t sum_dur = 0;
1224     hb_chapter_t *chapter = NULL;
1225     int i;
1226     for ( i = 0; i < chapter_num; ++i)
1227     {
1228         chapter = hb_list_item( stream->title->list_chapter, i );
1229         sum_dur += chapter->duration;
1230     }
1231     stream->chapter = chapter_num - 1;
1232     stream->chapter_end = sum_dur;
1233
1234     int64_t pos = ( ( ( sum_dur - chapter->duration ) * AV_TIME_BASE ) / 90000 );
1235
1236     hb_deep_log( 2, "Seeking to chapter %d: starts %"PRId64", ends %"PRId64", AV pos %"PRId64,
1237                  chapter_num, sum_dur - chapter->duration, sum_dur, pos);
1238
1239     if ( chapter_num > 1 && pos > 0 )
1240     {
1241         av_seek_frame( stream->ffmpeg_ic, -1, pos, 0);
1242     }
1243     return 1;
1244 }
1245
1246 /***********************************************************************
1247  * hb_stream_chapter
1248  ***********************************************************************
1249  * Return the number of the chapter that we are currently in. We store
1250  * the chapter number starting from 0, so + 1 for the real chpater num.
1251  **********************************************************************/
1252 int hb_stream_chapter( hb_stream_t * src_stream )
1253 {
1254     return( src_stream->chapter + 1 );
1255 }
1256
1257 /***********************************************************************
1258  * hb_stream_seek
1259  ***********************************************************************
1260  *
1261  **********************************************************************/
1262 int hb_stream_seek( hb_stream_t * stream, float f )
1263 {
1264         if ( stream->hb_stream_type == ffmpeg )
1265     {
1266         return ffmpeg_seek( stream, f );
1267     }
1268     off_t stream_size, cur_pos, new_pos;
1269     double pos_ratio = f;
1270     cur_pos = ftello( stream->file_handle );
1271     fseeko( stream->file_handle, 0, SEEK_END );
1272     stream_size = ftello( stream->file_handle );
1273     new_pos = (off_t) ((double) (stream_size) * pos_ratio);
1274     new_pos &=~ (HB_DVD_READ_BUFFER_SIZE - 1);
1275
1276     int r = fseeko( stream->file_handle, new_pos, SEEK_SET );
1277     if (r == -1)
1278     {
1279         fseeko( stream->file_handle, cur_pos, SEEK_SET );
1280         return 0;
1281     }
1282
1283     if ( stream->hb_stream_type == transport )
1284     {
1285         // We need to drop the current decoder output and move
1286         // forwards to the next transport stream packet.
1287         hb_ts_stream_reset(stream);
1288         if ( f > 0 )
1289         {
1290             if ( stream->ts_IDRs )
1291             {
1292                 // the stream has IDRs so look for one.
1293                 stream->need_keyframe = 1;
1294             }
1295         }
1296         else
1297         {
1298             // we're at the beginning - say we have video sync so that we
1299             // won't drop initial SPS & PPS data on an AVC stream.
1300             stream->need_keyframe = 0;
1301         }
1302     }
1303     else if ( stream->hb_stream_type == program )
1304     {
1305         skip_to_next_pack( stream );
1306     }
1307
1308     return 1;
1309 }
1310
1311 static const char* make_upper( const char* s )
1312 {
1313     static char name[8];
1314     char *cp = name;
1315     char *ep = cp + sizeof(name)-1;
1316
1317     while ( *s && cp < ep )
1318     {
1319         *cp++ = islower(*s)? toupper(*s) : *s;
1320         ++s;
1321     }
1322     *cp = 0;
1323     return name;
1324 }
1325
1326 static void set_audio_description( hb_audio_t *audio, iso639_lang_t *lang )
1327 {
1328     /* XXX
1329      * This is a duplicate of code in dvd.c - it should get factored out
1330      * into a common routine. We probably should only be putting the lang
1331      * code or a lang pointer into the audio config & let the common description
1332      * formatting routine in scan.c do all the stuff below.
1333      */
1334     const char *codec_name;
1335     AVCodecContext *cc;
1336
1337     if ( audio->config.in.codec == HB_ACODEC_FFMPEG &&
1338          ( cc = hb_ffmpeg_context( audio->config.in.codec_param ) ) &&
1339          avcodec_find_decoder( cc->codec_id ) )
1340     {
1341         codec_name = make_upper( avcodec_find_decoder( cc->codec_id )->name );
1342         if ( !strcmp( codec_name, "LIBFAAD" ) )
1343         {
1344             codec_name = "AAC";
1345         }
1346     }
1347     else if ( audio->config.in.codec == HB_ACODEC_MPGA &&
1348               avcodec_find_decoder( audio->config.in.codec_param ) )
1349     {
1350         codec_name = avcodec_find_decoder( audio->config.in.codec_param )->name;
1351     }
1352     else
1353     {
1354         codec_name = audio->config.in.codec == HB_ACODEC_AC3 ? "AC3" :
1355                      audio->config.in.codec == HB_ACODEC_DCA ? "DTS" :
1356                      audio->config.in.codec == HB_ACODEC_MPGA ? "MPEG" : 
1357                      audio->config.in.codec == HB_ACODEC_LPCM ? "LPCM" : 
1358                      audio->config.in.codec == HB_ACODEC_FFMPEG ? "FFMPEG" :
1359                      "Unknown";
1360     }
1361     snprintf( audio->config.lang.description,
1362               sizeof( audio->config.lang.description ), "%s (%s)",
1363               strlen(lang->native_name) ? lang->native_name : lang->eng_name,
1364               codec_name );
1365     snprintf( audio->config.lang.simple, sizeof( audio->config.lang.simple ), "%s",
1366               strlen(lang->native_name) ? lang->native_name : lang->eng_name );
1367     snprintf( audio->config.lang.iso639_2, sizeof( audio->config.lang.iso639_2 ),
1368               "%s", lang->iso639_2);
1369 }
1370
1371 static hb_audio_t *hb_ts_stream_set_audio_id_and_codec(hb_stream_t *stream,
1372                                                        int aud_pid_index)
1373 {
1374     off_t cur_pos = ftello(stream->file_handle);
1375     hb_audio_t *audio = calloc( sizeof( hb_audio_t ), 1 );
1376     const uint8_t *buf;
1377
1378     fseeko(stream->file_handle, 0, SEEK_SET);
1379     align_to_next_packet(stream);
1380     buf = hb_ts_stream_getPEStype(stream, stream->ts_audio_pids[aud_pid_index]);
1381
1382     /* check that we found a PES header */
1383     uint8_t stype = 0;
1384     if (buf && buf[0] == 0x00 && buf[1] == 0x00 && buf[2] == 0x01)
1385     {
1386         stype = stream->ts_stream_type[1 + aud_pid_index];
1387
1388         // 0xbd ("private stream 1") is the normal container for non-ISO
1389         // media - AC3/DCA/PCM/etc.
1390         if ( buf[3] == 0xbd )
1391         {
1392             if ( st2codec[stype].kind == U )
1393             {
1394                 // XXX assume unknown stream types are AC-3 (if they're not
1395                 // audio we'll find that out during the scan but if they're
1396                 // some other type of audio we'll end up ignoring them).
1397                 stype = 0x81;
1398                 stream->ts_stream_type[1 + aud_pid_index] = 0x81;
1399             }
1400         }
1401         else if ( buf[3] == 0xfd )
1402         {
1403             // 0xfd indicates an extended stream id (ISO 13818-1(2007)).
1404             // the blu ray consortium apparently forgot to read the portion
1405             // of the MPEG spec that says one PID should map to one media
1406             // stream and multiplexed multiple types of audio into one PID
1407             // using the extended stream identifier of the PES header to
1408             // distinguish them. So we have to check if that's happening and
1409             // if so tell the runtime what esid we want.
1410             if ( st2codec[stype].kind == A && stype == 0x83 &&
1411                  stream->ts_format_id[1 + aud_pid_index] == TS_FORMAT_ID_AC3 )
1412             {
1413                 // This is an interleaved TrueHD/AC-3 stream and the esid of
1414                 // the AC-3 is 0x76
1415                 stream->ts_multiplexed[1 + aud_pid_index] = 0x76;
1416                 stype = 0x81;
1417                 stream->ts_stream_type[1 + aud_pid_index] = 0x81;
1418             }
1419             if ( st2codec[stype].kind == A && stype == 0x86 )
1420             {
1421                 // This is an interleaved DTS-HD/DTS stream and the esid of
1422                 // the DTS is 0x71
1423                 stream->ts_multiplexed[1 + aud_pid_index] = 0x71;
1424                 stype = 0x82;
1425                 stream->ts_stream_type[1 + aud_pid_index] = 0x82;
1426             }
1427         }
1428         else if ((buf[3] & 0xe0) == 0xc0)
1429         {
1430             // 0xC0 - 0xCF are the normal containers for ISO-standard
1431             // media (mpeg2 audio and mpeg4 AAC).
1432             if ( st2codec[stype].kind == U )
1433             {
1434                 // XXX assume unknown stream types are MPEG audio
1435                 stype = 0x03;
1436                 stream->ts_stream_type[1 + aud_pid_index] = 0x03;
1437             }
1438         }
1439         else
1440         {
1441             stype = 0;
1442         }
1443     }
1444     // if we found an audio stream type & HB has a codec that can decode it
1445     // finish configuring the audio so we'll add it to the title's list.
1446     if ( st2codec[stype].kind == A && st2codec[stype].codec )
1447     {
1448         audio->id = 1 + aud_pid_index;
1449         audio->config.in.codec = st2codec[stype].codec;
1450         audio->config.in.codec_param = st2codec[stype].codec_param;
1451                 set_audio_description( audio,
1452                   lang_for_code( stream->a52_info[aud_pid_index].lang_code ) );
1453         hb_log("transport stream pid 0x%x (type 0x%x) may be %s audio (id 0x%x)",
1454                stream->ts_audio_pids[aud_pid_index],
1455                stype, st2codec[stype].name, audio->id);
1456     }
1457     else
1458     {
1459         if ( buf )
1460         {
1461             hb_log("transport stream pid 0x%x (type 0x%x, substream 0x%x) "
1462                     "isn't audio", stream->ts_audio_pids[aud_pid_index],
1463                     stream->ts_stream_type[1 + aud_pid_index], buf[3]);
1464         }
1465         else
1466         {
1467             hb_log("transport stream pid 0x%x (type 0x%x) isn't audio",
1468                     stream->ts_audio_pids[aud_pid_index],
1469                     stream->ts_stream_type[1 + aud_pid_index]);
1470         }
1471         }
1472     fseeko(stream->file_handle, cur_pos, SEEK_SET);
1473     return audio;
1474 }
1475
1476 static void add_audio_to_title(hb_title_t *title, int id)
1477 {
1478     hb_audio_t *audio = calloc( sizeof( hb_audio_t ), 1 );
1479
1480     audio->id = id;
1481     switch ( id >> 12 )
1482     {
1483         case 0x0:
1484             audio->config.in.codec = HB_ACODEC_MPGA;
1485             hb_log("add_audio_to_title: added MPEG audio stream 0x%x", id);
1486             break;
1487         case 0x2:
1488             // type 2 is a DVD subtitle stream - just ignore it */
1489             free( audio );
1490             return;
1491         case 0x8:
1492             audio->config.in.codec = HB_ACODEC_AC3;
1493             hb_log("add_audio_to_title: added AC3 audio stream 0x%x", id);
1494             break;
1495         case 0xa:
1496             audio->config.in.codec = HB_ACODEC_LPCM;
1497             hb_log("add_audio_to_title: added LPCM audio stream 0x%x", id);
1498             break;
1499         default:
1500             hb_log("add_audio_to_title: unknown audio stream type 0x%x", id);
1501             free( audio );
1502             return;
1503
1504     }
1505     set_audio_description( audio, lang_for_code( 0 ) );
1506     hb_list_add( title->list_audio, audio );
1507 }
1508
1509 static void hb_ps_stream_find_audio_ids(hb_stream_t *stream, hb_title_t *title)
1510 {
1511     off_t cur_pos = ftello(stream->file_handle);
1512     hb_buffer_t *buf  = hb_buffer_init(HB_DVD_READ_BUFFER_SIZE);
1513     hb_list_t *list = hb_list_init();
1514     // how many blocks we read while searching for audio streams
1515     int blksleft = 4096;
1516     // there can be at most 16 unique streams in an MPEG PS (8 in a DVD)
1517     // so we use a bitmap to keep track of the ones we've already seen.
1518     // Bit 'i' of smap is set if we've already added the audio for
1519     // audio substream id 'i' to the title's audio list.
1520     uint32_t smap = 0;
1521
1522     // start looking 20% into the file since there's occasionally no
1523     // audio at the beginning (particularly for vobs).
1524     hb_stream_seek(stream, 0.2f);
1525
1526     while (--blksleft >= 0 && hb_stream_read(stream, buf) == 1)
1527     {
1528         hb_buffer_t *es;
1529
1530         // 'buf' contains an MPEG2 PACK - get a list of all it's elementary streams
1531         hb_demux_ps( buf, list, 0 );
1532
1533         while ( ( es = hb_list_item( list, 0 ) ) )
1534         {
1535             hb_list_rem( list, es );
1536             if ( (es->id & 0xff) == 0xbd || (es->id & 0xe0) == 0xc0 )
1537             {
1538                 // this PES contains some kind of audio - get the substream id
1539                 // and check if we've seen it already.
1540                 int ssid = (es->id > 0xff ? es->id >> 8 : es->id) & 0xf;
1541                 if ( (smap & (1 << ssid)) == 0 )
1542                 {
1543                     // we haven't seen this stream before - add it to the
1544                     // title's list of audio streams.
1545                     smap |= (1 << ssid);
1546                     add_audio_to_title(title, es->id);
1547                 }
1548             }
1549             hb_buffer_close( &es );
1550         }
1551     }
1552     hb_list_empty( &list );
1553     hb_buffer_close(&buf);
1554     fseeko(stream->file_handle, cur_pos, SEEK_SET);
1555 }
1556
1557 /***********************************************************************
1558  * hb_ts_stream_init
1559  ***********************************************************************
1560  *
1561  **********************************************************************/
1562
1563 static void hb_ts_stream_init(hb_stream_t *stream)
1564 {
1565         int i;
1566
1567         for (i=0; i < kMaxNumberDecodeStreams; i++)
1568         {
1569                 stream->ts_streamcont[i] = -1;
1570         }
1571         stream->ts_video_pids[0] = -1;
1572     for ( i = 0; i < stream->ts_number_audio_pids; i++ )
1573     {
1574         stream-> ts_audio_pids[i] = -1;
1575     }
1576
1577     stream->ts_packet = malloc( stream->packetsize );
1578
1579         // Find the audio and video pids in the stream
1580         hb_ts_stream_find_pids(stream);
1581
1582         for (i = 0; i < stream->ts_number_video_pids + stream->ts_number_audio_pids; i++)
1583         {
1584         // demuxing buffer for TS to PS conversion
1585                 stream->ts_buf[i] = hb_buffer_init(stream->packetsize);
1586                 stream->ts_buf[i]->size = 0;
1587         }
1588 }
1589
1590 #define MAX_HOLE 208*80
1591
1592 static off_t align_to_next_packet(hb_stream_t *stream)
1593 {
1594     uint8_t buf[MAX_HOLE];
1595         off_t pos = 0;
1596     off_t start = ftello(stream->file_handle);
1597
1598     if ( start >= stream->packetsize ) {
1599         start -= stream->packetsize;
1600         fseeko(stream->file_handle, start, SEEK_SET);
1601     }
1602
1603     if (fread(buf, sizeof(buf), 1, stream->file_handle) == 1)
1604         {
1605         const uint8_t *bp = buf;
1606         int i;
1607
1608         for ( i = sizeof(buf); --i >= 0; ++bp )
1609         {
1610             if ( have_ts_sync( bp, stream->packetsize ) )
1611             {
1612                 break;
1613             }
1614         }
1615         if ( i >= 0 )
1616         {
1617             pos = ( bp - buf ) - stream->packetsize + 188;
1618             if ( pos < 0 )
1619                 pos = 0;
1620         }
1621         }
1622     fseeko(stream->file_handle, start+pos, SEEK_SET);
1623         return pos;
1624 }
1625
1626
1627 typedef struct {
1628     uint8_t *buf;
1629     uint32_t val;
1630     int pos;
1631 } bitbuf_t;
1632
1633 static const unsigned int bitmask[] = {
1634         0x0,0x1,0x3,0x7,0xf,0x1f,0x3f,0x7f,0xff,
1635         0x1ff,0x3ff,0x7ff,0xfff,0x1fff,0x3fff,0x7fff,0xffff,
1636         0x1ffff,0x3ffff,0x7ffff,0xfffff,0x1fffff,0x3fffff,0x7fffff,0xffffff,
1637         0x1ffffff,0x3ffffff,0x7ffffff,0xfffffff,0x1fffffff,0x3fffffff,0x7fffffff,0xffffffff};
1638
1639 static inline void set_buf(bitbuf_t *bb, uint8_t* buf, int bufsize, int clear)
1640 {
1641         bb->pos = 0;
1642         bb->buf = buf;
1643         bb->val = (bb->buf[0] << 24) | (bb->buf[1] << 16) |
1644               (bb->buf[2] << 8) | bb->buf[3];
1645         if (clear)
1646                 memset(bb->buf, 0, bufsize);
1647 }
1648
1649 static inline int buf_size(bitbuf_t *bb)
1650 {
1651         return bb->pos >> 3;
1652 }
1653
1654 static inline unsigned int get_bits(bitbuf_t *bb, int bits)
1655 {
1656         unsigned int val;
1657         int left = 32 - (bb->pos & 31);
1658
1659         if (bits < left)
1660         {
1661                 val = (bb->val >> (left - bits)) & bitmask[bits];
1662                 bb->pos += bits;
1663         }
1664         else
1665         {
1666                 val = (bb->val & bitmask[left]) << (bits - left);
1667                 bb->pos += left;
1668                 bits -= left;
1669
1670                 int pos = bb->pos >> 3;
1671                 bb->val = (bb->buf[pos] << 24) | (bb->buf[pos + 1] << 16) | (bb->buf[pos + 2] << 8) | bb->buf[pos + 3];
1672
1673                 if (bits > 0)
1674                 {
1675                         val |= (bb->val >> (32 - bits)) & bitmask[bits];
1676                         bb->pos += bits;
1677                 }
1678         }
1679
1680         return val;
1681 }
1682
1683 // extract what useful information we can from the elementary stream
1684 // descriptor list at 'dp' and add it to the stream at 'esindx'.
1685 // Descriptors with info we don't currently use are ignored.
1686 // The descriptor list & descriptor item formats are defined in
1687 // ISO 13818-1 (2000E) section 2.6 (pg. 62).
1688 static void decode_element_descriptors(hb_stream_t* stream, int esindx,
1689                                        const uint8_t *dp, uint8_t dlen)
1690 {
1691     const uint8_t *ep = dp + dlen;
1692
1693     while (dp < ep)
1694     {
1695         switch (dp[0])
1696         {
1697             case 5:    // Registration descriptor
1698                 stream->ts_format_id[esindx+1] = (dp[2] << 24) | (dp[3] << 16) |
1699                                                (dp[4] << 8)  | dp[5];
1700                 break;
1701
1702             case 10:    // ISO_639_language descriptor
1703                 stream->a52_info[esindx].lang_code = lang_to_code(lang_for_code2((const char *)&dp[2]));
1704                 break;
1705
1706             case 0x6a:  // DVB AC-3 descriptor
1707                 stream->ts_stream_type[esindx+1] = 0x81;
1708                 break;
1709
1710             default:
1711                 break;
1712         }
1713         dp += dp[1] + 2;
1714     }
1715 }
1716
1717 static const char *stream_type_name (uint8_t stream_type)
1718 {
1719     return st2codec[stream_type].name? st2codec[stream_type].name : "Unknown";
1720 }
1721
1722 int decode_program_map(hb_stream_t* stream)
1723 {
1724     bitbuf_t bb;
1725         set_buf(&bb, stream->pmt_info.tablebuf, stream->pmt_info.tablepos, 0);
1726
1727     get_bits(&bb, 8);  // table_id
1728     get_bits(&bb, 4);
1729     unsigned int section_length = get_bits(&bb, 12);
1730     stream->pmt_info.section_length = section_length;
1731
1732     unsigned int program_number = get_bits(&bb, 16);
1733     stream->pmt_info.program_number = program_number;
1734     get_bits(&bb, 2);
1735     get_bits(&bb, 5);  // version_number
1736     get_bits(&bb, 1);
1737     get_bits(&bb, 8);  // section_number
1738     get_bits(&bb, 8);  // last_section_number
1739     get_bits(&bb, 3);
1740     unsigned int PCR_PID = get_bits(&bb, 13);
1741     stream->pmt_info.PCR_PID = PCR_PID;
1742     get_bits(&bb, 4);
1743     unsigned int program_info_length = get_bits(&bb, 12);
1744     stream->pmt_info.program_info_length = program_info_length;
1745
1746         int i=0;
1747         unsigned char *descriptor_buf = (unsigned char *) malloc(program_info_length);
1748         for (i = 0; i < program_info_length; i++)
1749         {
1750           descriptor_buf[i] = get_bits(&bb, 8);
1751         }
1752
1753         int cur_pos =  9 /* data after the section length field*/ + program_info_length;
1754         int done_reading_stream_types = 0;
1755         while (!done_reading_stream_types)
1756     {
1757         unsigned char stream_type = get_bits(&bb, 8);
1758         get_bits(&bb, 3);
1759         unsigned int elementary_PID = get_bits(&bb, 13);
1760         get_bits(&bb, 4);
1761         unsigned int ES_info_length = get_bits(&bb, 12);
1762
1763         int i=0;
1764         unsigned char *ES_info_buf = (unsigned char *) malloc(ES_info_length);
1765         for (i=0; i < ES_info_length; i++)
1766         {
1767             ES_info_buf[i] = get_bits(&bb, 8);
1768         }
1769
1770
1771         if ( index_of_pid( elementary_PID, stream ) < 0 )
1772         {
1773             // don't have this pid yet
1774             if (stream->ts_number_video_pids == 0 && 
1775                 st2codec[stream_type].kind == V )
1776             {
1777                 stream->ts_video_pids[0] = elementary_PID;
1778                 stream->ts_stream_type[0] = stream_type;
1779                 stream->ts_number_video_pids = 1;
1780             }
1781             else
1782             {
1783                 // Defined audio stream types are 0x81 for AC-3/A52 audio 
1784                 // and 0x03 for mpeg audio. But content producers seem to 
1785                 // use other values (0x04 and 0x06 have both been observed) 
1786                 // so at this point we say everything that isn't a video 
1787                 // pid is audio then at the end of hb_stream_title_scan 
1788                 // we'll figure out which are really audio by looking at 
1789                 // the PES headers.
1790                 i = stream->ts_number_audio_pids;
1791                 if (i < kMaxNumberAudioPIDS)
1792                 {
1793                     stream->ts_audio_pids[i] = elementary_PID;
1794                     stream->ts_stream_type[1 + i] = stream_type;
1795                     if (ES_info_length > 0)
1796                     {
1797                         decode_element_descriptors(stream, i, ES_info_buf,
1798                                                 ES_info_length);
1799                     }
1800                     ++stream->ts_number_audio_pids;
1801                 }
1802             }
1803         }
1804
1805         cur_pos += 5 /* stream header */ + ES_info_length;
1806
1807         free(ES_info_buf);
1808
1809         if (cur_pos >= section_length - 4 /* stop before the CRC */)
1810             done_reading_stream_types = 1;
1811     }
1812
1813         free(descriptor_buf);
1814         return 1;
1815 }
1816
1817 static int build_program_map(const uint8_t *buf, hb_stream_t *stream)
1818 {
1819     // Get adaption header info
1820     int adapt_len = 0;
1821     int adaption = (buf[3] & 0x30) >> 4;
1822     if (adaption == 0)
1823             return 0;
1824     else if (adaption == 0x2)
1825             adapt_len = 184;
1826     else if (adaption == 0x3)
1827             adapt_len = buf[4] + 1;
1828     if (adapt_len > 184)
1829             return 0;
1830
1831     // Get payload start indicator
1832     int start;
1833     start = (buf[1] & 0x40) != 0;
1834
1835     // Get pointer length - only valid in packets with a start flag
1836     int pointer_len = 0;
1837
1838         if (start)
1839         {
1840                 pointer_len = buf[4 + adapt_len] + 1;
1841                 stream->pmt_info.tablepos = 0;
1842         }
1843         // Get Continuity Counter
1844         int continuity_counter = buf[3] & 0x0f;
1845         if (!start && (stream->pmt_info.current_continuity_counter + 1 != continuity_counter))
1846         {
1847                 hb_log("build_program_map - Continuity Counter %d out of sequence - expected %d", continuity_counter, stream->pmt_info.current_continuity_counter+1);
1848                 return 0;
1849         }
1850         stream->pmt_info.current_continuity_counter = continuity_counter;
1851         stream->pmt_info.reading |= start;
1852
1853     // Add the payload for this packet to the current buffer
1854         int amount_to_copy = 184 - adapt_len - pointer_len;
1855     if (stream->pmt_info.reading && (amount_to_copy > 0))
1856     {
1857                         stream->pmt_info.tablebuf = realloc(stream->pmt_info.tablebuf, stream->pmt_info.tablepos + amount_to_copy);
1858
1859             memcpy(stream->pmt_info.tablebuf + stream->pmt_info.tablepos, buf + 4 + adapt_len + pointer_len, amount_to_copy);
1860             stream->pmt_info.tablepos += amount_to_copy;
1861     }
1862     if (stream->pmt_info.tablepos > 3)
1863     {
1864         // We have enough to check the section length
1865         int length;
1866         length = ((stream->pmt_info.tablebuf[1] << 8) + 
1867                   stream->pmt_info.tablebuf[2]) & 0xFFF;
1868         if (stream->pmt_info.tablepos > length + 1)
1869         {
1870             // We just finished a bunch of packets - parse the program map details
1871             int decode_ok = 0;
1872             if (stream->pmt_info.tablebuf[0] == 0x02)
1873                 decode_ok = decode_program_map(stream);
1874             free(stream->pmt_info.tablebuf);
1875             stream->pmt_info.tablebuf = NULL;
1876             stream->pmt_info.tablepos = 0;
1877             stream->pmt_info.reading = 0;
1878             if (decode_ok)
1879                 return decode_ok;
1880         }
1881
1882     }
1883
1884     return 0;
1885 }
1886
1887 static int decode_PAT(const uint8_t *buf, hb_stream_t *stream)
1888 {
1889     unsigned char tablebuf[1024];
1890     unsigned int tablepos = 0;
1891
1892     int reading = 0;
1893
1894
1895     // Get adaption header info
1896     int adapt_len = 0;
1897     int adaption = (buf[3] & 0x30) >> 4;
1898     if (adaption == 0)
1899             return 0;
1900     else if (adaption == 0x2)
1901             adapt_len = 184;
1902     else if (adaption == 0x3)
1903             adapt_len = buf[4] + 1;
1904     if (adapt_len > 184)
1905             return 0;
1906
1907     // Get pointer length
1908     int pointer_len = buf[4 + adapt_len] + 1;
1909
1910     // Get payload start indicator
1911     int start;
1912     start = (buf[1] & 0x40) != 0;
1913
1914     if (start)
1915             reading = 1;
1916
1917     // Add the payload for this packet to the current buffer
1918     if (reading && (184 - adapt_len) > 0)
1919     {
1920             if (tablepos + 184 - adapt_len - pointer_len > 1024)
1921             {
1922                     hb_log("decode_PAT - Bad program section length (> 1024)");
1923                     return 0;
1924             }
1925             memcpy(tablebuf + tablepos, buf + 4 + adapt_len + pointer_len, 184 - adapt_len - pointer_len);
1926             tablepos += 184 - adapt_len - pointer_len;
1927     }
1928
1929     if (start && reading)
1930     {
1931             memcpy(tablebuf + tablepos, buf + 4 + adapt_len + 1, pointer_len - 1);
1932
1933
1934             unsigned int pos = 0;
1935             //while (pos < tablepos)
1936             {
1937                     bitbuf_t bb;
1938                     set_buf(&bb, tablebuf + pos, tablepos - pos, 0);
1939
1940                     unsigned char section_id    = get_bits(&bb, 8);
1941                     get_bits(&bb, 4);
1942                     unsigned int section_len    = get_bits(&bb, 12);
1943                     get_bits(&bb, 16); // transport_id
1944                     get_bits(&bb, 2);
1945                     get_bits(&bb, 5);  // version_num
1946                     get_bits(&bb, 1);  // current_next
1947                     get_bits(&bb, 8);  // section_num
1948                     get_bits(&bb, 8);  // last_section
1949
1950                     switch (section_id)
1951                     {
1952                       case 0x00:
1953                         {
1954                           // Program Association Section
1955                           section_len -= 5;    // Already read transport stream ID, version num, section num, and last section num
1956                           section_len -= 4;   // Ignore the CRC
1957                           int curr_pos = 0;
1958                                                   stream->ts_number_pat_entries = 0;
1959                           while ((curr_pos < section_len) && (stream->ts_number_pat_entries < kMaxNumberPMTStreams))
1960                           {
1961                             unsigned int pkt_program_num = get_bits(&bb, 16);
1962                                                         stream->pat_info[stream->ts_number_pat_entries].program_number = pkt_program_num;
1963
1964                             get_bits(&bb, 3);  // Reserved
1965                             if (pkt_program_num == 0)
1966                             {
1967                               get_bits(&bb, 13); // pkt_network_id
1968                             }
1969                             else
1970                             {
1971                               unsigned int pkt_program_map_PID = get_bits(&bb, 13);
1972                                 stream->pat_info[stream->ts_number_pat_entries].program_map_PID = pkt_program_map_PID;
1973                             }
1974                             curr_pos += 4;
1975                                                         stream->ts_number_pat_entries++;
1976                           }
1977                         }
1978                         break;
1979                       case 0xC7:
1980                             {
1981                                     break;
1982                             }
1983                       case 0xC8:
1984                             {
1985                                     break;
1986                             }
1987                     }
1988
1989                     pos += 3 + section_len;
1990             }
1991
1992             tablepos = 0;
1993     }
1994     return 1;
1995 }
1996
1997 static void hb_ts_stream_find_pids(hb_stream_t *stream)
1998 {
1999     // To be different from every other broadcaster in the world, New Zealand TV
2000     // changes PMTs (and thus video & audio PIDs) when 'programs' change. Since
2001     // we may have the tail of the previous program at the beginning of this
2002     // file, take our PMT from the middle of the file.
2003     fseeko(stream->file_handle, 0, SEEK_END);
2004     uint64_t fsize = ftello(stream->file_handle);
2005     fseeko(stream->file_handle, fsize >> 1, SEEK_SET);
2006     align_to_next_packet(stream);
2007
2008         // Read the Transport Stream Packets (188 bytes each) looking at first for PID 0 (the PAT PID), then decode that
2009         // to find the program map PID and then decode that to get the list of audio and video PIDs
2010
2011         for (;;)
2012         {
2013         const uint8_t *buf = next_packet( stream );
2014
2015         if ( buf == NULL )
2016         {
2017                         hb_log("hb_ts_stream_find_pids - end of file");
2018                         break;
2019                 }
2020
2021                 // Get pid
2022                 int pid = (((buf[1] & 0x1F) << 8) | buf[2]) & 0x1FFF;
2023
2024         if ((pid == 0x0000) && (stream->ts_number_pat_entries == 0))
2025                 {
2026                   decode_PAT(buf, stream);
2027                   continue;
2028                 }
2029
2030                 int pat_index = 0;
2031                 for (pat_index = 0; pat_index < stream->ts_number_pat_entries; pat_index++)
2032                 {
2033                         // There are some streams where the PAT table has multiple entries as if their are
2034                         // multiple programs in the same transport stream, and yet there's actually only one
2035                         // program really in the stream. This seems to be true for transport streams that
2036                         // originate in the HDHomeRun but have been output by EyeTV's export utility. What I think
2037                         // is happening is that the HDHomeRun is sending the entire transport stream as broadcast,
2038                         // but the EyeTV is only recording a single (selected) program number and not rewriting the
2039                         // PAT info on export to match what's actually on the stream.
2040                         // Until we have a way of handling multiple programs per transport stream elegantly we'll match
2041                         // on the first pat entry for which we find a matching program map PID.  The ideal solution would
2042                         // be to build a title choice popup from the PAT program number details and then select from
2043                         // their - but right now the API's not capable of that.
2044             if (stream->pat_info[pat_index].program_number != 0 &&
2045                 pid == stream->pat_info[pat_index].program_map_PID)
2046                         {
2047                           if (build_program_map(buf, stream) > 0)
2048                                 break;
2049                         }
2050                 }
2051                 // Keep going  until we have a complete set of PIDs
2052                 if (stream->ts_number_video_pids > 0)
2053                   break;
2054         }
2055
2056         hb_log("hb_ts_stream_find_pids - found the following PIDS");
2057         hb_log("    Video PIDS : ");
2058     int i;
2059         for (i=0; i < stream->ts_number_video_pids; i++)
2060         {
2061         hb_log( "      0x%x type %s (0x%x)", 
2062                 stream->ts_video_pids[i],
2063                 stream_type_name(stream->ts_stream_type[i]),
2064                 stream->ts_stream_type[i]);
2065         }
2066         hb_log("    Audio PIDS : ");
2067         for (i = 0; i < stream->ts_number_audio_pids; i++)
2068         {
2069         hb_log( "      0x%x type %s (0x%x)", 
2070                 stream->ts_audio_pids[i],
2071                 stream_type_name(stream->ts_stream_type[i+1]),
2072                 stream->ts_stream_type[i+1] );
2073         }
2074  }
2075
2076
2077 static void fwrite64( hb_stream_t *stream, void *buf, int len )
2078 {
2079     if ( len > 0 )
2080     {
2081         int pos = stream->fwrite_buf->size;
2082         if ( pos + len > stream->fwrite_buf->alloc )
2083         {
2084             int size = MAX(stream->fwrite_buf->alloc * 2, pos + len);
2085             hb_buffer_realloc(stream->fwrite_buf, size);
2086         }
2087         memcpy( &(stream->fwrite_buf->data[pos]), buf, len );
2088         stream->fwrite_buf->size += len;
2089     }
2090 }
2091
2092 // convert a PES PTS or DTS to an int64
2093 static int64_t pes_timestamp( const uint8_t *pes )
2094 {
2095     int64_t ts = ( (uint64_t)(pes[0] & 0xe ) << 29 );
2096     ts |= ( pes[1] << 22 ) | ( ( pes[2] >> 1 ) << 15 ) |
2097           ( pes[3] << 7 ) | ( pes[4] >> 1 );
2098     return ts;
2099 }
2100
2101 static void generate_output_data(hb_stream_t *stream, int curstream)
2102 {
2103     hb_buffer_t *buf = stream->fwrite_buf;
2104     uint8_t *tdat = stream->ts_buf[curstream]->data;
2105
2106     buf->id = curstream;
2107
2108     // check if this packet was referenced to an older pcr and if that
2109     // pcr was significantly different than the one we're using now.
2110     // (the reason for the uint cast on the pcr difference is that the
2111     // difference is significant if it advanced by more than 200ms or if
2112     // it went backwards by any amount. The negative numbers look like huge
2113     // unsigned ints so the cast allows both conditions to be checked at once.
2114     int bufpcr = stream->ts_buf[curstream]->cur;
2115     int curpcr = stream->ts_pcr_out;
2116     if ( bufpcr && bufpcr < curpcr &&
2117          (uint64_t)(stream->ts_pcrhist[curpcr & 3] - stream->ts_pcrhist[bufpcr & 3]) > 200*90LL )
2118     {
2119         // we've sent up a new pcr but have a packet referenced to an
2120         // old pcr and the difference was enough to trigger a discontinuity
2121         // correction. smash the timestamps or we'll mess up the correction.
2122         buf->start = -1;
2123         buf->renderOffset = -1;
2124     }
2125     else
2126     {
2127         if ( stream->ts_pcr_out != stream->ts_pcr_in )
2128         {
2129             // we have a new pcr
2130             stream->ts_pcr_out = stream->ts_pcr_in;
2131             buf->stop = stream->ts_pcr;
2132             stream->ts_pcrhist[stream->ts_pcr_out & 3] = stream->ts_pcr;
2133         }
2134         else
2135         {
2136             buf->stop = -1;
2137         }
2138
2139         // put the PTS & possible DTS into 'start' & 'renderOffset' then strip
2140         // off the PES header.
2141         if ( tdat[7] & 0xc0 )
2142         {
2143             buf->start = pes_timestamp( tdat + 9 );
2144             buf->renderOffset = ( tdat[7] & 0x40 )? pes_timestamp( tdat + 14 ) :
2145                                                     buf->start;
2146         }
2147         else
2148         {
2149             buf->start = -1;
2150             buf->renderOffset = -1;
2151         }
2152     }
2153     int hlen = tdat[8] + 9;
2154
2155     fwrite64( stream,  tdat + hlen, stream->ts_pos[curstream] - hlen );
2156
2157     stream->ts_pos[curstream] = 0;
2158     stream->ts_buf[curstream]->size = 0;
2159 }
2160
2161 static void hb_ts_stream_append_pkt(hb_stream_t *stream, int idx, const uint8_t *buf, int len)
2162 {
2163     if (stream->ts_pos[idx] + len > stream->ts_buf[idx]->alloc)
2164     {
2165         int size;
2166
2167         size = MAX(stream->ts_buf[idx]->alloc * 2, stream->ts_pos[idx] + len);
2168         hb_buffer_realloc(stream->ts_buf[idx], size);
2169     }
2170     memcpy(stream->ts_buf[idx]->data + stream->ts_pos[idx], buf, len);
2171     stream->ts_pos[idx] += len;
2172     stream->ts_buf[idx]->size += len;
2173 }
2174
2175 /***********************************************************************
2176  * hb_ts_stream_decode
2177  ***********************************************************************
2178  *
2179  **********************************************************************/
2180 static int hb_ts_stream_decode( hb_stream_t *stream, hb_buffer_t *obuf )
2181 {
2182     /*
2183      * stash the output buffer pointer in our stream so we don't have to
2184      * pass it & its original value to everything we call.
2185      */
2186     obuf->size = 0;
2187     stream->fwrite_buf = obuf;
2188
2189         // spin until we get a packet of data from some stream or hit eof
2190         while ( 1 )
2191         {
2192         int curstream;
2193
2194         const uint8_t *buf = next_packet(stream);
2195         if ( buf == NULL )
2196         {
2197             // end of file - we didn't finish filling our ps write buffer
2198             // so just discard the remainder (the partial buffer is useless)
2199             hb_log("hb_ts_stream_decode - eof");
2200             return 0;
2201                 }
2202
2203         /* This next section validates the packet */
2204
2205                 // Get pid and use it to find stream state.
2206                 int pid = ((buf[1] & 0x1F) << 8) | buf[2];
2207         if ( ( curstream = index_of_pid( pid, stream ) ) < 0 )
2208             continue;
2209
2210                 // Get error
2211                 int errorbit = (buf[1] & 0x80) != 0;
2212                 if (errorbit)
2213                 {
2214                         ts_err( stream, curstream,  "packet error bit set");
2215                         continue;
2216                 }
2217
2218                 // Get adaption header info
2219                 int adaption = (buf[3] & 0x30) >> 4;
2220                 int adapt_len = 0;
2221                 if (adaption == 0)
2222                 {
2223                         ts_err( stream, curstream,  "adaptation code 0");
2224                         continue;
2225                 }
2226                 else if (adaption == 0x2)
2227                         adapt_len = 184;
2228                 else if (adaption == 0x3)
2229                 {
2230                         adapt_len = buf[4] + 1;
2231                         if (adapt_len > 184)
2232                         {
2233                                 ts_err( stream, curstream,  "invalid adapt len %d", adapt_len);
2234                 continue;
2235                         }
2236                 }
2237
2238         if ( adapt_len > 0 )
2239         {
2240             if ( buf[5] & 0x40 )
2241             {
2242                 // found a random access point
2243             }
2244             // if there's an adaptation header & PCR_flag is set
2245             // get the PCR (Program Clock Reference)
2246             if ( adapt_len > 7 && ( buf[5] & 0x10 ) != 0 )
2247             {
2248                 stream->ts_pcr = ( (uint64_t)buf[6] << (33 - 8) ) |
2249                                  ( (uint64_t)buf[7] << (33 - 16) ) |
2250                                  ( (uint64_t)buf[8] << (33 - 24) ) |
2251                                  ( (uint64_t)buf[9] << (33 - 32) ) |
2252                                  ( buf[10] >> 7 );
2253                 ++stream->ts_pcr_in;
2254                 stream->ts_found_pcr = 1;
2255             }
2256         }
2257
2258         // If we don't have a PCR yet but the stream has PCRs just loop
2259         // so we don't process anything until we have a clock reference.
2260         // Unfortunately the HD Home Run appears to null out the PCR so if
2261         // we didn't detect a PCR during scan keep going and we'll use
2262         // the video stream DTS for the PCR.
2263
2264         if ( !stream->ts_found_pcr && ( stream->ts_flags & TS_HAS_PCR ) )
2265         {
2266             continue;
2267         }
2268
2269                 // Get continuity
2270         // Continuity only increments for adaption values of 0x3 or 0x01
2271         // and is not checked for start packets.
2272
2273                 int start = (buf[1] & 0x40) != 0;
2274
2275         if ( (adaption & 0x01) != 0 )
2276                 {
2277             int continuity = (buf[3] & 0xF);
2278             if ( continuity == stream->ts_streamcont[curstream] )
2279             {
2280                 // Spliced transport streams can have duplicate 
2281                 // continuity counts at the splice boundary.
2282                 // Test to see if the packet is really a duplicate
2283                 // by comparing packet summaries to see if they
2284                 // match.
2285                 uint8_t summary[8];
2286
2287                 summary[0] = adaption;
2288                 summary[1] = adapt_len;
2289                 if (adapt_len + 4 + 6 + 9 <= 188)
2290                 {
2291                     memcpy(&summary[2], buf+4+adapt_len+9, 6);
2292                 }
2293                 else
2294                 {
2295                     memset(&summary[2], 0, 6);
2296                 }
2297                 if ( memcmp( summary, stream->ts_pkt_summary[curstream], 8 ) == 0 )
2298                 {
2299                     // we got a duplicate packet (usually used to introduce
2300                     // a PCR when one is needed). The only thing that can
2301                     // change in the dup is the PCR which we grabbed above
2302                     // so ignore the rest.
2303                     continue;
2304                 }
2305             }
2306             if ( !start && (stream->ts_streamcont[curstream] != -1) &&
2307                  !stream->ts_skipbad[curstream] &&
2308                  (continuity != ( (stream->ts_streamcont[curstream] + 1) & 0xf ) ) )
2309                         {
2310                                 ts_err( stream, curstream,  "continuity error: got %d expected %d",
2311                         (int)continuity,
2312                         (stream->ts_streamcont[curstream] + 1) & 0xf );
2313                 stream->ts_streamcont[curstream] = continuity;
2314                 continue;
2315             }
2316             stream->ts_streamcont[curstream] = continuity;
2317
2318             // Save a summary of this packet for later duplicate
2319             // testing.  The summary includes some header information
2320             // and payload bytes.  Should be enough to detect 
2321             // non-duplicates.
2322             stream->ts_pkt_summary[curstream][0] = adaption;
2323             stream->ts_pkt_summary[curstream][1] = adapt_len;
2324             if (adapt_len + 4 + 6 + 9 <= 188)
2325             {
2326                 memcpy(&stream->ts_pkt_summary[curstream][2], 
2327                         buf+4+adapt_len+9, 6);
2328             }
2329             else
2330             {
2331                 memset(&stream->ts_pkt_summary[curstream][2], 0, 6);
2332             }
2333         }
2334
2335         /* If we get here the packet is valid - process its data */
2336
2337         if ( start )
2338         {
2339             // Found a random access point (now we can start a frame/audio packet..)
2340
2341             if ( stream->need_keyframe )
2342             {
2343                 // we're looking for the first video frame because we're
2344                 // doing random access during 'scan'
2345                 if ( curstream != 0 || !isIframe( stream, buf, adapt_len ) )
2346                 {
2347                     // not the video stream or didn't find an I frame
2348                     // but we'll only wait 255 video frames for an I frame.
2349                     if ( curstream != 0 || ++stream->need_keyframe )
2350                     {
2351                         continue;
2352                     }
2353                 }
2354                 stream->need_keyframe = 0;
2355             }
2356
2357                         // If we were skipping a bad packet, start fresh on this new PES packet..
2358                         if (stream->ts_skipbad[curstream] == 1)
2359                         {
2360                                 stream->ts_skipbad[curstream] = 0;
2361                         }
2362
2363                         if ( curstream == 0 )
2364             {
2365                 ++stream->frames;
2366
2367                 // if we don't have a pcr yet use the dts from this frame
2368                 if ( !stream->ts_found_pcr )
2369                 {
2370                     // PES must begin with an mpeg start code & contain
2371                     // a DTS or PTS.
2372                     const uint8_t *pes = buf + adapt_len + 4;
2373                     if ( pes[0] != 0x00 || pes[1] != 0x00 || pes[2] != 0x01 ||
2374                          ( pes[7] >> 6 ) == 0 )
2375                     {
2376                         continue;
2377                     }
2378                     // if we have a dts use it otherwise use the pts
2379                     stream->ts_pcr = pes_timestamp( pes + ( pes[7] & 0x40? 14 : 9 ) );
2380                     ++stream->ts_pcr_in;
2381                 }
2382             }
2383
2384             // if this is a multiplexed stream make sure this is the
2385             // substream we want.
2386             if ( stream->ts_multiplexed[curstream] )
2387             {
2388                 // PES must begin with an mpeg start code & contain
2389                 // a DTS or PTS.
2390                 const uint8_t *pes = buf + adapt_len + 4;
2391                 if ( pes[0] != 0x00 || pes[1] != 0x00 || pes[2] != 0x01 ||
2392                      pes[3] != 0xfd )
2393                 {
2394                     stream->ts_skipbad[curstream] = 1;
2395                     continue;
2396                 }
2397                 // the last byte of the header is the extension id. see if
2398                 // it's the one we want.
2399                 if ( pes[pes[8]+8] != stream->ts_multiplexed[curstream] )
2400                 {
2401                     stream->ts_skipbad[curstream] = 1;
2402                     continue;
2403                 }
2404             }
2405
2406             // If we have some data already on this stream, turn it into
2407             // a program stream packet. Then add the payload for this
2408             // packet to the current pid's buffer.
2409             if ( stream->ts_pos[curstream] )
2410             {
2411                 // we have to ship the old packet before updating the pcr
2412                 // since the packet we've been accumulating is referenced
2413                 // to the old pcr.
2414                 generate_output_data(stream, curstream);
2415
2416                 // remember the pcr that was in effect when we started
2417                 // this packet.
2418                 stream->ts_buf[curstream]->cur = stream->ts_pcr_in;
2419                 hb_ts_stream_append_pkt(stream, curstream, buf + 4 + adapt_len,
2420                                         184 - adapt_len);
2421                 return 1;
2422             }
2423             // remember the pcr that was in effect when we started this packet.
2424             stream->ts_buf[curstream]->cur = stream->ts_pcr_in;
2425         }
2426
2427                 // Add the payload for this packet to the current buffer
2428                 if (!stream->ts_skipbad[curstream] && (184 - adapt_len) > 0)
2429                 {
2430             hb_ts_stream_append_pkt(stream, curstream, buf + 4 + adapt_len,
2431                                     184 - adapt_len);
2432             // see if we've hit the end of this PES packet
2433             const uint8_t *pes = stream->ts_buf[curstream]->data;
2434             int len = ( pes[4] << 8 ) + pes[5] + 6;
2435             if ( len > 6 && stream->ts_pos[curstream] == len &&
2436                  pes[0] == 0x00 && pes[1] == 0x00 && pes[2] == 0x01 )
2437             {
2438                 generate_output_data(stream, curstream);
2439                 return 1;
2440             }
2441                 }
2442         }
2443 }
2444
2445 static void hb_ts_stream_reset(hb_stream_t *stream)
2446 {
2447         int i;
2448
2449         for (i=0; i < kMaxNumberDecodeStreams; i++)
2450         {
2451                 stream->ts_pos[i] = 0;
2452                 stream->ts_skipbad[i] = 1;
2453                 stream->ts_streamcont[i] = -1;
2454         }
2455
2456     stream->need_keyframe = 0;
2457
2458     stream->ts_found_pcr = 0;
2459     stream->ts_pcr_out = 0;
2460     stream->ts_pcr_in = 0;
2461     stream->ts_pcr = 0;
2462
2463     stream->frames = 0;
2464     stream->errors = 0;
2465     stream->last_error_frame = -10000;
2466     stream->last_error_count = 0;
2467
2468     align_to_next_packet(stream);
2469 }
2470
2471 // ------------------------------------------------------------------
2472 // Support for reading media files via the ffmpeg libraries.
2473
2474 static void ffmpeg_add_codec( hb_stream_t *stream, int stream_index )
2475 {
2476     // add a codec to the context here so it will be there when we
2477     // read the first packet.
2478     AVCodecContext *context = stream->ffmpeg_ic->streams[stream_index]->codec;
2479     context->workaround_bugs = FF_BUG_AUTODETECT;
2480     context->error_recognition = 1;
2481     context->error_concealment = FF_EC_GUESS_MVS|FF_EC_DEBLOCK;
2482     AVCodec *codec = avcodec_find_decoder( context->codec_id );
2483     hb_avcodec_open( context, codec );
2484 }
2485
2486 // The ffmpeg stream reader / parser shares a lot of state with the 
2487 // decoder via a codec context kept in the AVStream of the reader's
2488 // AVFormatContext. Since decoding is done in a different thread we
2489 // have to somehow pass this codec context to the decoder and we have
2490 // to do it before the first packet is read (so we can't put the info
2491 // in the buf we'll send downstream). Decoders don't have any way to
2492 // get to the stream directly (they're not passed the title or job
2493 // pointers during a scan) so this is a back door for the decoder to
2494 // get the codec context. We just stick the stream pointer in the next
2495 // slot an array of pointers maintained as a circular list then return
2496 // the index into the list combined with the ffmpeg stream index as the
2497 // codec_param that will be passed to the decoder init routine. We make
2498 // the list 'big' (enough for 1024 simultaneously open ffmpeg streams)
2499 // so that we don't have to do a complicated allocator or worry about
2500 // deleting entries on close. 
2501 //
2502 // Entries can only be added to this list during a scan and are never
2503 // deleted so the list access doesn't require locking.
2504 static hb_stream_t **ffmpeg_streams;    // circular list of stream pointers
2505 static int ffmpeg_stream_cur;           // where we put the last stream pointer
2506 #define ffmpeg_sl_bits (10)             // log2 stream list size (in entries)
2507 #define ffmpeg_sl_size (1 << ffmpeg_sl_bits)
2508
2509 // add a stream to the list & return the appropriate codec_param to access it
2510 static int ffmpeg_codec_param( hb_stream_t *stream, int stream_index )
2511 {
2512     if ( !ffmpeg_streams )
2513     {
2514         ffmpeg_streams = calloc( ffmpeg_sl_size, sizeof(stream) );
2515     }
2516
2517     // the title scan adds all the ffmpeg media streams at once so we
2518     // only add a new entry to our stream list if the stream is different
2519     // than last time.
2520     int slot = ffmpeg_stream_cur;
2521     if ( ffmpeg_streams[slot] != stream )
2522     {
2523         // new stream - put it in the next slot of the stream list
2524         slot = ++ffmpeg_stream_cur & (ffmpeg_sl_size - 1);
2525         ffmpeg_streams[slot] = stream;
2526     }
2527
2528     ffmpeg_add_codec( stream, stream_index );
2529
2530     return ( stream_index << ffmpeg_sl_bits ) | slot;
2531 }
2532
2533 // we're about to open 'title' to convert it - remap the stream associated
2534 // with the video & audio codec params of the title to refer to 'stream'
2535 // (the original scan stream was closed and no longer exists).
2536 static void ffmpeg_remap_stream( hb_stream_t *stream, hb_title_t *title )
2537 {
2538     // all the video & audio came from the same stream so remapping
2539     // the video's stream slot takes care of everything.
2540     int slot = title->video_codec_param & (ffmpeg_sl_size - 1);
2541     ffmpeg_streams[slot] = stream;
2542
2543     // add codecs for all the streams used by the title
2544     ffmpeg_add_codec( stream, title->video_codec_param >> ffmpeg_sl_bits );
2545
2546     int i;
2547     hb_audio_t *audio;
2548     for ( i = 0; ( audio = hb_list_item( title->list_audio, i ) ); ++i )
2549     {
2550         if ( audio->config.in.codec == HB_ACODEC_FFMPEG )
2551         {
2552             ffmpeg_add_codec( stream,
2553                               audio->config.in.codec_param >> ffmpeg_sl_bits );
2554         }
2555     }
2556 }
2557
2558 void *hb_ffmpeg_context( int codec_param )
2559 {
2560     int slot = codec_param & (ffmpeg_sl_size - 1);
2561     int stream_index = codec_param >> ffmpeg_sl_bits;
2562     return ffmpeg_streams[slot]->ffmpeg_ic->streams[stream_index]->codec;
2563 }
2564
2565 void *hb_ffmpeg_avstream( int codec_param )
2566 {
2567     int slot = codec_param & (ffmpeg_sl_size - 1);
2568     int stream_index = codec_param >> ffmpeg_sl_bits;
2569     return ffmpeg_streams[slot]->ffmpeg_ic->streams[stream_index];
2570 }
2571
2572 static AVFormatContext *ffmpeg_deferred_close;
2573
2574 static int ffmpeg_open( hb_stream_t *stream, hb_title_t *title )
2575 {
2576     if ( ffmpeg_deferred_close )
2577     {
2578         av_close_input_file( ffmpeg_deferred_close );
2579         ffmpeg_deferred_close = NULL;
2580     }
2581     AVFormatContext *ic;
2582
2583     av_log_set_level( AV_LOG_ERROR );
2584     if ( av_open_input_file( &ic, stream->path, NULL, 0, NULL ) < 0 )
2585     {
2586         return 0;
2587     }
2588     if ( av_find_stream_info( ic ) < 0 )
2589         goto fail;
2590
2591     stream->ffmpeg_ic = ic;
2592     stream->hb_stream_type = ffmpeg;
2593     stream->ffmpeg_pkt = malloc(sizeof(*stream->ffmpeg_pkt));
2594     av_init_packet( stream->ffmpeg_pkt );
2595     stream->chapter_end = INT64_MAX;
2596
2597     if ( title )
2598     {
2599         // we're opening for read. scan passed out codec params that
2600         // indexed its stream so we need to remap them so they point
2601         // to this stream.
2602         ffmpeg_remap_stream( stream, title );
2603         av_log_set_level( AV_LOG_ERROR );
2604     }
2605     else
2606     {
2607         // we're opening for scan. let ffmpeg put some info into the
2608         // log about what we've got.
2609         av_log_set_level( AV_LOG_INFO );
2610         dump_format( ic, 0, stream->path, 0 );
2611         av_log_set_level( AV_LOG_ERROR );
2612
2613         // accept this file if it has at least one video stream we can decode
2614         int i;
2615         for (i = 0; i < ic->nb_streams; ++i )
2616         {
2617             if ( ic->streams[i]->codec->codec_type == CODEC_TYPE_VIDEO )
2618             {
2619                 break;
2620             }
2621         }
2622         if ( i >= ic->nb_streams )
2623             goto fail;
2624     }
2625     return 1;
2626
2627   fail:
2628     av_close_input_file( ic );
2629     return 0;
2630 }
2631
2632 static void ffmpeg_close( hb_stream_t *d )
2633 {
2634     // XXX since we're sharing the CodecContext with the downstream
2635     // decoder proc we can't close the stream. We need to reference count
2636     // this so we can close it when both are done with their instance but
2637     // for now just defer the close until the next stream open or close.
2638     if ( ffmpeg_deferred_close )
2639     {
2640         av_close_input_file( ffmpeg_deferred_close );
2641     }
2642     ffmpeg_deferred_close = d->ffmpeg_ic;
2643     if ( d->ffmpeg_pkt != NULL )
2644     {
2645         free( d->ffmpeg_pkt );
2646         d->ffmpeg_pkt = NULL;
2647     }
2648 }
2649
2650 static void add_ffmpeg_audio( hb_title_t *title, hb_stream_t *stream, int id )
2651 {
2652     AVStream *st = stream->ffmpeg_ic->streams[id];
2653     AVCodecContext *codec = st->codec;
2654
2655     // scan will ignore any audio without a bitrate. Since we've already
2656     // typed the audio in order to determine its codec we set up the audio
2657     // paramters here.
2658     if ( codec->bit_rate || codec->sample_rate )
2659     {
2660         static const int chan2layout[] = {
2661             HB_INPUT_CH_LAYOUT_MONO,  // We should allow no audio really.
2662             HB_INPUT_CH_LAYOUT_MONO,   
2663             HB_INPUT_CH_LAYOUT_STEREO,
2664             HB_INPUT_CH_LAYOUT_2F1R,   
2665             HB_INPUT_CH_LAYOUT_2F2R,
2666             HB_INPUT_CH_LAYOUT_3F2R,   
2667             HB_INPUT_CH_LAYOUT_4F2R,
2668             HB_INPUT_CH_LAYOUT_STEREO, 
2669             HB_INPUT_CH_LAYOUT_STEREO,
2670         };
2671
2672         hb_audio_t *audio = calloc( 1, sizeof(*audio) );;
2673
2674         audio->id = id;
2675         if ( codec->codec_id == CODEC_ID_AC3 )
2676         {
2677             audio->config.in.codec = HB_ACODEC_AC3;
2678         }
2679         else if ( codec->codec_id == CODEC_ID_DTS )
2680         {
2681             audio->config.in.codec = HB_ACODEC_DCA;
2682         }
2683         else
2684         {
2685             audio->config.in.codec = HB_ACODEC_FFMPEG;
2686             audio->config.in.codec_param = ffmpeg_codec_param( stream, id );
2687
2688             audio->config.in.bitrate = codec->bit_rate? codec->bit_rate : 1;
2689             audio->config.in.samplerate = codec->sample_rate;
2690             audio->config.in.channel_layout = chan2layout[codec->channels & 7];
2691         }
2692
2693         set_audio_description( audio, lang_for_code2( st->language ) );
2694
2695         hb_list_add( title->list_audio, audio );
2696     }
2697 }
2698
2699 static hb_title_t *ffmpeg_title_scan( hb_stream_t *stream )
2700 {
2701     AVFormatContext *ic = stream->ffmpeg_ic;
2702
2703     // 'Barebones Title'
2704     hb_title_t *title = hb_title_init( stream->path, 0 );
2705     title->index = 1;
2706
2707         // Copy part of the stream path to the title name
2708         char *sep = strrchr(stream->path, '/');
2709         if (sep)
2710                 strcpy(title->name, sep+1);
2711         char *dot_term = strrchr(title->name, '.');
2712         if (dot_term)
2713                 *dot_term = '\0';
2714
2715     uint64_t dur = ic->duration * 90000 / AV_TIME_BASE;
2716     title->duration = dur;
2717     dur /= 90000;
2718     title->hours    = dur / 3600;
2719     title->minutes  = ( dur % 3600 ) / 60;
2720     title->seconds  = dur % 60;
2721
2722     // set the title to decode the first video stream in the file
2723     title->demuxer = HB_NULL_DEMUXER;
2724     title->video_codec = 0;
2725     int i;
2726     for (i = 0; i < ic->nb_streams; ++i )
2727     {
2728         if ( ic->streams[i]->codec->codec_type == CODEC_TYPE_VIDEO &&
2729              avcodec_find_decoder( ic->streams[i]->codec->codec_id ) &&
2730              title->video_codec == 0 )
2731         {
2732             title->video_id = i;
2733             stream->ffmpeg_video_id = i;
2734
2735             // We have to use the 'internal' avcodec decoder because
2736             // it needs to share the codec context from this video
2737             // stream. The parser internal to av_read_frame
2738             // passes a bunch of state info to the decoder via the context.
2739             title->video_codec = WORK_DECAVCODECVI;
2740             title->video_codec_param = ffmpeg_codec_param( stream, i );
2741         }
2742         else if ( ic->streams[i]->codec->codec_type == CODEC_TYPE_AUDIO &&
2743                   avcodec_find_decoder( ic->streams[i]->codec->codec_id ) )
2744         {
2745             add_ffmpeg_audio( title, stream, i );
2746         }
2747     }
2748
2749     title->container_name = strdup( ic->iformat->name );
2750     title->data_rate = ic->bit_rate;
2751
2752     hb_deep_log( 2, "Found ffmpeg %d chapters, container=%s", ic->nb_chapters, ic->iformat->name );
2753
2754     if( ic->nb_chapters != 0 )
2755     {
2756         AVChapter *m;
2757         uint64_t duration_sum = 0;
2758         for( i = 0; i < ic->nb_chapters; i++ )
2759             if( ( m = ic->chapters[i] ) != NULL )
2760             {
2761                 hb_chapter_t * chapter;
2762                 chapter = calloc( sizeof( hb_chapter_t ), 1 );
2763                 chapter->index    = i+1;
2764                 chapter->duration = ( m->end / ( (double) m->time_base.num * m->time_base.den ) ) * 90000  - duration_sum;
2765                 duration_sum     += chapter->duration;
2766                 chapter->hours    = chapter->duration / 90000 / 3600;
2767                 chapter->minutes  = ( ( chapter->duration / 90000 ) % 3600 ) / 60;
2768                 chapter->seconds  = ( chapter->duration / 90000 ) % 60;
2769                 strcpy( chapter->title, m->title );
2770                 hb_deep_log( 2, "Added chapter %i, name='%s', dur=%"PRIu64", (%02i:%02i:%02i)",
2771                             chapter->index, chapter->title,
2772                             chapter->duration, chapter->hours,
2773                             chapter->minutes, chapter->seconds );
2774                 hb_list_add( title->list_chapter, chapter );
2775             }
2776     }
2777
2778     /*
2779      * Fill the metadata.
2780      */
2781     decmetadata( title );
2782
2783     if( hb_list_count( title->list_chapter ) == 0 )
2784     {
2785         // Need at least one chapter
2786         hb_chapter_t * chapter;
2787         chapter = calloc( sizeof( hb_chapter_t ), 1 );
2788         chapter->index = 1;
2789         chapter->duration = title->duration;
2790         chapter->hours = title->hours;
2791         chapter->minutes = title->minutes;
2792         chapter->seconds = title->seconds;
2793         hb_list_add( title->list_chapter, chapter );
2794     }
2795
2796     return title;
2797 }
2798
2799 static int64_t av_to_hb_pts( int64_t pts, double conv_factor )
2800 {
2801     if ( pts == AV_NOPTS_VALUE )
2802         return -1;
2803     return (int64_t)( (double)pts * conv_factor );
2804 }
2805
2806 static int ffmpeg_is_keyframe( hb_stream_t *stream )
2807 {
2808     uint8_t *pkt;
2809
2810     switch ( stream->ffmpeg_ic->streams[stream->ffmpeg_video_id]->codec->codec_id )
2811     {
2812         case CODEC_ID_VC1:
2813             // XXX the VC1 codec doesn't mark key frames so to get previews
2814             // we do it ourselves here. The decoder gets messed up if it
2815             // doesn't get a SEQ header first so we consider that to be a key frame.
2816             pkt = stream->ffmpeg_pkt->data;
2817             if ( !pkt[0] && !pkt[1] && pkt[2] == 1 && pkt[3] == 0x0f )
2818                 return 1;
2819
2820             return 0;
2821
2822         case CODEC_ID_WMV3:
2823             // XXX the ffmpeg WMV3 codec doesn't mark key frames.
2824             // Only M$ could make I-frame detection this complicated: there
2825             // are two to four bits of unused junk ahead of the frame type
2826             // so we have to look at the sequence header to find out how much
2827             // to skip. Then there are three different ways of coding the type
2828             // depending on whether it's main or advanced profile then whether
2829             // there are bframes or not so we have to look at the sequence
2830             // header to get that.
2831             pkt = stream->ffmpeg_pkt->data;
2832             uint8_t *seqhdr = stream->ffmpeg_ic->streams[stream->ffmpeg_video_id]->codec->extradata;
2833             int pshift = 2;
2834             if ( ( seqhdr[3] & 0x02 ) == 0 )
2835                 // no FINTERPFLAG
2836                 ++pshift;
2837             if ( ( seqhdr[3] & 0x80 ) == 0 )
2838                 // no RANGEREDUCTION
2839                 ++pshift;
2840             if ( seqhdr[3] & 0x70 )
2841                 // stream has b-frames
2842                 return ( ( pkt[0] >> pshift ) & 0x3 ) == 0x01;
2843
2844             return ( ( pkt[0] >> pshift ) & 0x2 ) == 0;
2845
2846         default:
2847             break;
2848     }
2849     return ( stream->ffmpeg_pkt->flags & PKT_FLAG_KEY );
2850 }
2851
2852 static int ffmpeg_read( hb_stream_t *stream, hb_buffer_t *buf )
2853 {
2854     int err;
2855   again:
2856     if ( ( err = av_read_frame( stream->ffmpeg_ic, stream->ffmpeg_pkt )) < 0 )
2857     {
2858         // XXX the following conditional is to handle avi files that
2859         // use M$ 'packed b-frames' and occasionally have negative
2860         // sizes for the null frames these require.
2861         if ( err != AVERROR_NOMEM || stream->ffmpeg_pkt->size >= 0 )
2862             // eof
2863             return 0;
2864     }
2865     if ( stream->ffmpeg_pkt->size <= 0 )
2866     {
2867         // M$ "invalid and inefficient" packed b-frames require 'null frames'
2868         // following them to preserve the timing (since the packing puts two
2869         // or more frames in what looks like one avi frame). The contents and
2870         // size of these null frames are ignored by the ff_h263_decode_frame
2871         // as long as they're < 20 bytes. We need a positive size so we use
2872         // one byte if we're given a zero or negative size. We don't know
2873         // if the pkt data points anywhere reasonable so we just stick a
2874         // byte of zero in our outbound buf.
2875         buf->size = 1;
2876         *buf->data = 0;
2877     }
2878     else
2879     {
2880         if ( stream->ffmpeg_pkt->size > buf->alloc )
2881         {
2882             // sometimes we get absurd sizes from ffmpeg
2883             if ( stream->ffmpeg_pkt->size >= (1 << 25) )
2884             {
2885                 hb_log( "ffmpeg_read: pkt too big: %d bytes", stream->ffmpeg_pkt->size );
2886                 av_free_packet( stream->ffmpeg_pkt );
2887                 return ffmpeg_read( stream, buf );
2888             }
2889             // need to expand buffer
2890             hb_buffer_realloc( buf, stream->ffmpeg_pkt->size );
2891         }
2892         memcpy( buf->data, stream->ffmpeg_pkt->data, stream->ffmpeg_pkt->size );
2893         buf->size = stream->ffmpeg_pkt->size;
2894     }
2895     buf->id = stream->ffmpeg_pkt->stream_index;
2896     if ( buf->id == stream->ffmpeg_video_id )
2897     {
2898         if ( stream->need_keyframe )
2899         {
2900             // we've just done a seek (generally for scan or live preview) and
2901             // want to start at a keyframe. Some ffmpeg codecs seek to a key
2902             // frame but most don't. So we spin until we either get a keyframe
2903             // or we've looked through 50 video frames without finding one.
2904             if ( ! ffmpeg_is_keyframe( stream ) && ++stream->need_keyframe < 50 )
2905             {
2906                 av_free_packet( stream->ffmpeg_pkt );
2907                 goto again;
2908             }
2909             stream->need_keyframe = 0;
2910         }
2911         ++stream->frames;
2912     }
2913
2914     // if we haven't done it already, compute a conversion factor to go
2915     // from the ffmpeg timebase for the stream to HB's 90KHz timebase.
2916     double tsconv = stream->ffmpeg_tsconv[stream->ffmpeg_pkt->stream_index];
2917     if ( ! tsconv )
2918     {
2919         AVStream *s = stream->ffmpeg_ic->streams[stream->ffmpeg_pkt->stream_index];
2920         tsconv = 90000. * (double)s->time_base.num / (double)s->time_base.den;
2921         stream->ffmpeg_tsconv[stream->ffmpeg_pkt->stream_index] = tsconv;
2922     }
2923
2924     buf->start = av_to_hb_pts( stream->ffmpeg_pkt->pts, tsconv );
2925     buf->renderOffset = av_to_hb_pts( stream->ffmpeg_pkt->dts, tsconv );
2926     if ( buf->renderOffset >= 0 && buf->start == -1 )
2927     {
2928         buf->start = buf->renderOffset;
2929     }
2930
2931     /*
2932      * Check to see whether this video buffer is on a chapter
2933      * boundary, if so mark it as such in the buffer then advance
2934      * chapter_end to the end of the next chapter.
2935      * If there are no chapters, chapter_end is always initialized to INT64_MAX
2936      * (roughly 3 million years at our 90KHz clock rate) so the test
2937      * below handles both the chapters & no chapters case.
2938      */
2939     if ( buf->id == stream->ffmpeg_video_id && buf->start >= stream->chapter_end )
2940     {
2941         hb_chapter_t *chapter = hb_list_item( stream->title->list_chapter,
2942                                               stream->chapter+1 );
2943         if( chapter )
2944         {
2945             stream->chapter++;
2946             stream->chapter_end += chapter->duration;
2947             buf->new_chap = stream->chapter + 1;
2948             hb_deep_log( 2, "ffmpeg_read starting chapter %i at %"PRId64,
2949                          buf->new_chap, buf->start);
2950         } else {
2951             // Must have run out of chapters, stop looking.
2952             stream->chapter_end = INT64_MAX;
2953         }
2954     } else {
2955         buf->new_chap = 0;
2956     }
2957     av_free_packet( stream->ffmpeg_pkt );
2958     return 1;
2959 }
2960
2961 static int ffmpeg_seek( hb_stream_t *stream, float frac )
2962 {
2963     AVFormatContext *ic = stream->ffmpeg_ic;
2964     if ( frac > 0. )
2965     {
2966         int64_t pos = (double)ic->duration * (double)frac;
2967         if ( ic->start_time != AV_NOPTS_VALUE && ic->start_time > 0 )
2968         {
2969             pos += ic->start_time;
2970         }
2971         av_seek_frame( ic, -1, pos, 0 );
2972         stream->need_keyframe = 1;
2973     }
2974     else
2975     {
2976         av_seek_frame( ic, -1, 0LL, AVSEEK_FLAG_BACKWARD );
2977     }
2978     return 1;
2979 }